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在 本 书 的 开篇 ， 我 们 首先 概要 地 介绍 C 语言 ， 主 要 是 通过 实际 的 程序 引 
入 C 语言 的 基本 元 素 ， 至 于 其 中 的 具体 细节 、 规 则 以 及 一 些 例 外 情 
况 ， 在 此 暂时 不 多 做 讨论 。 因 此 ， 本 章 不 准备 完整 、 详 细 地 讨论 C 语 
言 中 的 一 些 技术 ( 当 然 ， 这 里 所 举 的 所 有 例子 都 是 正确 的 )。 我 们 是 希望 
读者 能 尽快 地 编写 出 有 用 的 程序 ， 为 此 ， 本 章 将 重点 介绍 一 些 基本 概 
念 ， 比 如 变量 与 常量 、 算 术 运 算 、 控 制 流 、 函 数 、 基 本 输入 /输出 等 。 
而 对 于 编写 较 大 型 程序 所 涉及 到 的 一 些 重 要 特性 ， 比 如 指针 、 结 构 、C 
语言 中 十 分 丰富 的 运算 符 集 合 、 部 分 控制 流 语句 以 及 标准 库 等 ， 本 章 
将 暂 不 做 讨论 。 


这 种 讲解 方式 也 有 缺点 。 应 当 提 请 注意 的 是 ， 在 本 章 的 内 容 中 无 法 找到 
任何 特定 语言 特 性 的 完整 说 明 ， 并 且 ， 由 于 比较 简略 ， 可 能 会 使 读者 
产生 一 些 误 解 ;再 者 ， 由 于 所 举 的 例子 并 没有 用 到 C 语言 的 所 有 强大 功 
能 ， 因 此 ， 这 些 例子 也 许 并 不 简洁 、 精 炼 。 虽 然 我 们 已 经 尽 力 将 这 些 
问题 的 影响 降 到 最 低 ， 但 问题 肯定 还 是 存在 。 另 一 个 不 足 之 处 在 于 ， 本 
章 所 讲 的 某 些 内 容 在 后 续 相 关 章节 还 必须 再 次 讲述 。 我 们 希望 这 种 重 
复 给 读者 带 来 的 帮助 效果 远 远 超过 它 的 负面 影响 。 

无 论 是 利 还 是 次 ， 一 个 经 验 丰 富 的 程序 员 应 该 可 以 从 本 音 介 绍 的 内 容 中 
推 知 他 们 自己 进 行程 序 设 计 所 需要 的 一 些 基本 元 素 。 初 学 者 应 编写 一 
些 类 似 的 小 程序 作为 本 章 内 容 的 补充 练 习 。 无 论 是 经 验 丰富 的 程序 员 
还 是 初学 者 ， 都 可 以 把 本 章 作为 后 续 各 章 详细 讲解 的 内 容 的 框 。 

1.1 AT] 


学 习 一 门 新 程序 设计 语言 的 惟一 途径 就 是 使 用 它 编写 程序 。 对 于 所 有 语 
言 的 初学 者 来 说 ， 编写 的 第 一 个 程序 几乎 都 是 相同 的 ， 即 : 


请 打印 出 下 列 内 容 
hello, world 


尽管 这 个 练习 很 简单 ， 但 对 于 初学 语言 的 人 来 说 ， 它 仍然 可 能 成 为 一 大 
障碍 ， 因 为 要 实 现 这 个 目的 ， 我 们 首先 必须 编写 程 厅 文 本 ， 然 后 成 功 

































































地 运行 编译 ， 并 加 载 、 运 行 ， 最 后 输出 到 东 个 地 方 。 掌 握 了 这 些 操作 
细节 以 后 ， 其 它 事情 就 比较 容易 了 。 


在 C 语言 中 ， 我 们 可 以 用 下 列 程序 打印 出 * hello, world": 





#include <stdio.h> 
main() 

{ 

printf("hello, world\n"); 
} 


如 何 运行 这 个 程序 取决 于 所 使 用 的 系统 。 这 里 举 一 个 特殊 的 例子 。 在 
UNIX 操作 系统 中 ， 





首先 必须 在 某 个 文件 中 建立 这 个 源 程序 ， 并 以 “ .c" 作 为 文件 的 扩展 
名 ， 例 如 hello.c， 然 后 再 通过 下 列 命令 进行 编译 : 


cc hello.c 


WMR WHEE AATA te (Bl OOP EFT ETT), Sa PERS IA 
进行 ， 并 生成 一 个 可 执行 文件 aout。 然 后 ， 我 们 输入 : 


a.out 


即 可 运行 aout， 打 印 出 下 列 信息 : hello, world 


它 操作 系统 中 ， 编 译 、 加 载 、 运 行 等 规则 会 有 所 不 同 。 
#include <stdio.h> main() 

{ 

printf("hello, world\n"); 

} 


包含 标准 库 的 信息 定义 名 为 main 的 函数 ， 它 不 接受 参数 值 main 函数 
的 语句 都 被 括 在 花 括号 中 


main 函数 调用 库 函 数 printf 以 显示 字符 序列 ; 
\n 代表 换行 符 

第 一 
 C if a 


下 面 对 程 序 本 身 做 些 说 明 。 一 个 C 语言 程序 ， 无 论 其 大 小 如 何 ， 都 是 由 
函数 和 变量 组 成 的 。 函 数 中 包含 一 些 语 句 ， 以 指定 所 要 执行 的 计算 操 
作 ; 变 量 则 用 于 存储 计算 过 程 中 使 用 的 值 。C 语言 中 的 函数 类 似 于 
Fortran 语言 中 的 子 程序 和 函数 ， 与 Pascal 语言 中 的 过 程 和 函数 也 很 类 
Whe FEA BIA, PRAHA main. TS. PRA A YA RR 





制 ， 但 main 是 一 个 特殊 的 函数 名 一 一 每 个 程序 都 从 main 函数 的 起 点 
开始 执行 ， 这 意味 着 每 个 程序 都 必须 在 某 个 位 置 包含 一 个 main 函数 。 


main 函数 通常 会 调用 其 它 函 数 来 帮助 完成 某 些 工作 ， 被 调用 的 函数 可 
以 是 程序 设计 和 人员 自己 编写 的 ， 也 可 以 来 自 于 函数 库 。 上 述 程序 耻 中 
ATA 


#include <stdio.h> 


用 于 告诉 编译 器 在 本 程序 中 包含 标准 输入 /输出 库 的 信息 。 许 多 C 语言 
源 程序 的 开始 处 都 包 含 这 一 行 语句 。 我 们 将 在 第 7 章 和 附录 B 中 对 标 
准 库 进行 详细 介绍 。 


函数 之 间 进 行 数据 交换 的 一 种 方法 是 调用 函数 向 被 调用 函数 提供 一 个 值 
( 称 为 参数 ) 列 表 。 函 数 名 后 面 的 一 对 圆 括号 将 参数 列表 括 起 来 。 在 本 例 
H, main 冰 数 不 需要 任何 参数 ， 因 此 用 空 参数 表 () 表 示 。 


函数 中 的 语句 用 一 对 花 括 号 和 { 括 起 来 。 本 例 中 的 main 函数 仅 包 含 下 面 
js 














printf("hello, world\n"); 


调用 函数 时 ， 只 需要 使 用 函数 名 加 上 用 圆 括号 括 起 来 的 参数 表 即 可 。 上 
面 这 条 语句 将 "hello, world\n"。 作 为 参数 调用 printf 函数 。printf 是 一 个 
用 于 打印 得 出 的 库 函 数 ， 在 此 处 ， 它 打印 双 引 号 中 间 的 字符 串 。 


用 双 引 扎 括 起 来 的 字符 序列 称 为 字符 串 或 字符 串 第 量 ， 如 "hello， l 
world\n" ize A 字符 串 。 目 前 我 们 仅 使 用 字符 串 作 为 printf XH E K 
数 的 参数 。 

在 C 语 言 中 ， 字 符 序 列 \n 表示 换行 符 ， 在 打印 中 遇 到 它 时 ， 输 出 打印 将 


换行 ， 从 下 一 行 的 左 端 行 首开 始 。 如 果 去 掉 字 符 串 中 的 \n( 这 是 个 值得 
一 做 的 练习 )， 即 使 输出 打印 完成 后 也 





不 会 换行 。 在 printf 函数 的 参数 中 ， 只 能 用 \ 表示 换行 行 。 如 果 用 程序 
HIRITAR Ën, H 如 : 


printf("hello, world "); 
C 编译 器 将 会 产生 一 条 错误 信息 。 


printf 函数 永远 不 会 目 动 换 行 ， 这 样 我 们 可 以 多 次 调用 该 函数 以 分 阶段 
得 到 一 个 长 的 输 出 行 。 上 面 给 出 的 第 一 个 程序 也 可 以 改写 成 下 列 形式 : 


#include <stdio.h> 








main() 

{ 

printf("hello, "); 

printf(""world"); 

printf("\n"); 

} 

这 段 程序 与 前 面 的 程序 的 输出 相同 。 

请 注意 ，N 只 代表 一 个 字符 。 类 似 于 \n 的 转 义 字符 序列 为 表示 无 法 输入 
的 字符 或 不 可 见 字符 提供 了 一 种 通用 的 可 扩充 的 机 制 。 除 此 之 外 ，C 语 
言 提 供 的 转 义 字符 序列 还 包括 :t 表 示 制 表 符 ;\b 表示 回 退 符 表示 双 引 
写 汶 表示 肥 斜 杠 符 本 身 。2.3 节 将 给 出 转 义 字符 序 列 的 完整 列表 。 


练习 191 在 你 自己 的 系统 中 运行 “ hello, world" 程 序 。 再 有 意 去 掉 程序 中 
的 部 分 内 容 ， 看 看 会 得 到 什么 出 错 信息 。 


练习 192 做 个 实验 ， 当 printf 函数 的 参数 字符 串 中 包含 \c( 其 中 c 是 上 面 
的 转 义 字符 序列 中 未 曾 列 出 的 某 一 个 字符 ) 时 ， 观 察 一 下 会 出 现 什 么 情 
况 。 





























1.2 变量 与 算术 表达 式 


我 们 来 看 下 一 个 程序 ， 使 用 公式 c=(5/9)(F*32) 打 印 下 列 华氏 温度 与 摄氏 
温度 对 照 表 : 





op 
d 


| 





此 程序 中 仍然 只 包括 一 个 名 为 main 的 函数 定义 。 它 比 前 面 打印 * hello, 
world" 的 程序 


长 一 些 ， 但 并 不 复 人 本。 这 个 程序 中 引入 了 一 些 新 的 概念 ， 包 括 注 释 、 声 
明 、 变 量 、 算 术 表 达 式 、 循 环 以 及 格式 化 输出 。 该 程序 如 下 所 示 : 


#include <stdio.h> 





/* 当 fahr=0, 20, ..., 300 时 ,分 别 打印 华氏 温度 与 摄氏 温度 对 照 表 
*/ 

main() 

{ 


int fahr, celsius; 
int lower, upper, step; 


lower = 0; /* 温度 表 的 下 限 */ upper = 300; /* 温度 表 的 上 限 */ step = 20; 


Mie 
fahr = lower; 
while (fahr <= upper) { 


celsius = 5 * (fahre32) / 9; printf("%d\t%d\n", fahr, celsius); fahr = fahr + 
step; 


} 

} 

其 中 的 两 行 : 

/*=4 fahr=0，20，... ，300 时 ， 分 别 打印 华氏 温度 与 摄氏 温度 对 照 表 */ 


称 为 注释 ， 此 处 ， 它 简单 地 解释 ， 该 程序 是 做 什么 用 的 。 包 含 在 /* 与 */ 
之 间 的 字符 序列 将 被 编译 器 忽略 。 注 释 可 以 自由 地 运用 在 程序 中 ， 使 
得 程序 更 易于 理解 。 程 序 中 人 允许 出 现 空格 、 制 表 符 或 换行 符 之 处 ， 都 
可 以 使 用 注释 。 





在 C 语 言 中 ， 所 有 变量 都 必须 先 声明 后 使 用 。 声 明 通 常 放 在 函数 起 始 
处 ， 在 任何 可 执行 语句 之 前 。 声 明 用 于 说 明 变 量 的 属性 ， 它 由 一 个 类 
型 名 和 一 个 变量 表 组 成 ， 例 如 : 





int fahr, celsius; 
int lower, upper, step; 


其 中 ， 类 型 int 表示 其 后 所 列 变 量 为 整数 ， 与 之 相对 应 的 ，float 表示 所 
列 变 量 为 浮 点 数 ( 即 ， 可 以 带 有 小 数 部 分 的 数 )。int 与 float 类 型 的 取 值 
范围 取决 于 具体 的 机 器 。 对 于 int 类 型 ， 通 常 为 16 位 ， 其 取 值 范围 在 
°32768032767 之 间 ， 也 有 用 32 位 表示 的 int 类 型 。float 类 型 通常 是 32 
位 ， 它 至 少 有 6 位 有 效 数 字 ， 取 值 范围 一 般 在 102010 2A. 


BR int 与 float 类 型 之 外 ，C 语 高 还 提供 了 其 它 一 些 基本 数据 类 型 ， 例 如 : 





char 字符 一 一 一 个 字 节 
short 短 整 型 

long 长 整 型 

double 双 精 度 浮 点 型 





这 些 数据 类 型 对 象 的 大 小 也 取决 于 具体 的 机 器 。 另 外 ， 还 存在 这 些 基 本 
数据 类 型 的 数组 、 结 构 、 联 合 ， 指 癌 这 些 类 型 的 指针 以 及 返回 这 些 类 
型 值 的 函 教 。 我 们 将 在 后 续 相 应 的 章节 中 分 别 介 绍 。 


在 上 面 的 温度 转换 程序 中 ， 最 开始 执行 的 计算 是 下 列 4 个 赋值 语句 : 


lower = 0; 
upper = 300; 
step = 20; fahr = lower; 


它们 为 变量 设置 初 值 。 各 条 语句 均 以 分 写 结束 。 温度 转换 表 中 的 各 行 
计算 方式 相同 ， 因 此 可 以 用 循环 语句 重复 输出 各 行 。 这 是 while 循 


环 语句 的 用 途 : 








while (fahr <= upper) { 


} 


while 循环 语句 的 执行 方式 是 这 样 的 : 首先 测 试 圆 括 号 中 的 条 件 ;如 
果 条 件 为 真 (fahr<=uppenD， 则 执行 循环 体 ( 括 在 花 括号 中 的 3 条 语句 ); 然 
后 再 重新 测试 圆 括号 中 的 条件， 如果 为 真 ， 则 再 次 执行 循环 体 ; 当 圆 括 
号 中 的 条 件 测试 结果 为 假 (fahr>uppern) 时 ， 循环 结束 ， 并 继续 执行 跟 在 
while 循环 语句 之 后 的 下 一 条 语句 。 在 本 程序 中 ， 循 环 语句 后 没有 其 它 
语句 ， 因 此 整个 程序 的 执行 终止 。 


while 语句 的 循环 体 可 以 是 用 人 花 括 号 括 起 来 的 一 条 或 多 条 语句 (如 上 面 的 
温度 转换 程序 )， 也 可 以 是 不 用 花 括 号 包括 的 单条 语句 ， 例 如 : 


while (i <j) i =2 * i; 


在 这 两 种 情况 下 ， 我 们 总 是 把 由 while 控制 的 语句 缩 进 一 个 制 表 位 ， 这 
样 就 可 以 很 容易 地 看 出 循环 语句 中 包含 哪些 语句 。 这 种 缩 进 方式 突出 
了 程序 的 逻辑 结构 。 尽 管 C 编译 器 并 不 关心 程序 的 外 观 形式 ， 但 正确 
的 缩 进 以 及 保留 适当 空格 的 程序 设计 风格 对 程序 的 易 读 性 非常 重要 。 
我 们 建议 每 行 只 书写 一 条 语句 ， 并 在 运算 符 两 边 各 加 上 一 个 空格 字符 ， 
这 样 可 以 使 得 运算 的 结合 关系 更 清楚 明了 。 相 比 而 言 ， 花 括号 的 位 置 
就 不 那么 重要 了 。 我 们 从 比较 流行 的 一 些 风 格 中 选择 了 一 种 ， 读 者 可 
以 选择 适合 自己 的 一 种 风格 ， 并 养 成 一 直 使 用 这 种 风格 的 好 习惯 。 


























在 该 程序 中 ， 绝 大 部 分 工作 都 是 在 循环 体 中 完成 的 。 循 环 体 中 的 赋值 语 


口 


celsius = 5 * (fahr ° 32) /9: 用 于 计算 与 指定 华氏 温度 相对 应 的 摄 
氏 温 度 值 ， 并 将 结果 赋值 给 变量 celsius。 在 该 语句 中 ， 


之 所 以 把 表达 式 写成 先 乘 5 然后 再 除 以 9 而 不 是 直接 写成 519， 其 原因 
是 在 C 语言 及 许多 


其 它 语言 中 ， 整 数 除 法 操作 将 执行 舍 位 ， 结 果 中 的 任何 小 数 部 分 都 会 被 
EF. HHT 5 Al 9 都 


是 整数 ，5 /9 相 除 后 经 截取 所 得 的 结果 为 0， 因此 这 样 求 得 的 所 有 摄氏 
温度 都 将 为 0。 


从 该 例子 中 也 可 以 看 出 printf 函数 的 一 些 功能 。printf 是 一 个 通用 输出 格 
式 化 函数 ， 第 7 章 将 对 此 做 详细 介绍 。 该 函数 的 第 一 个 参数 是 待 打 印 
的 字符 串 ， 其 中 的 每 个 百 分 号 (96) 表示 其 它 的 参数 (第 二 个 、 第 三 个 、 
ee 参数 ) 之 一 进行 替换 的 位 置 ， 并 指定 打印 格式 。 例 如 ，9%6d 指定 一 个 
整 型 参数 ， 因 此 语句 


printf(" %d\t%d\n", fahr, celsius); 


用 于 打印 两 个 整数 fahr 与 celsius 的 值 ， 并 在 两 者 之 间 留 一 个 制 表 符 的 
空间 Q(t)。 


printf 冰 数 的 第 一 个 参数 中 的 各 个 % 分 别 对 应 于 第 二 个 、 第 三 个 、..……… 
参数 ， 它 们 在 数 目 和 类 型 上 都 必须 匹配 ， 否 则 将 出 现 错误 的 结果 。 

















顺便 指出 ，printf 函数 并 不 是 C 语言 本 身 的 一 部 分 ，C 语言 本 身 并 没有 
定义 输入 /输出 功能 。printf 仅仅 是 标准 库 函 数 中 一 个 有 用 的 函数 而 已 ， 

这 些 标准 序 函 数 在 C 语言 程序 中 通常 都 可 以 使 用 。 但 是 ，ANSI 标准 定 
MCS printf 函数 的 行为 ， 因 此 ， 对 每 个 符合 该 标准 的 编译 器 和 库 来 说 ， 

该 函数 的 属性 都 是 相同 的 。 


为 了 将 重点 放 到 讲述 C 语言 本 身上 ， 我 们 在 第 7 章 之 前 的 各 章 中 将 不 再 
对 输入 /输出 做 更 多 的 介绍 ， 并 且 ， 特 别 将 格式 化 输入 推 后 到 第 7 章 讲 
解 。 如 果 读 者 想 了 解数 据 输入 ， 可 以 先 阅 读 7.4 市 中 对 scanf 函数 的 讨 
论 部 分 ，scanf 函数 类 似 于 printf 函数 ， 但 它 用 于 读 输 入 数据 而 不 是 与 
输出 数据 。 

上 述 的 温度 转换 程序 存在 两 个 问题 。 比 较 简单 的 问题 是 ， 由 于 输出 的 数 
不 是 右 对 齐 的 ， 所 以 输出 的 结果 不 是 很 美观 。 这 个 问题 比较 容易 解决 : 
如 果 在 printf 语句 的 第 一 个 参数 的 


%d 中 指明 打印 宽度 ， 则 打印 的 数字 会 在 打印 区 域内 右 对 齐 。 例 如 ， 可 
以 用 语句 


printf(" %3d %6d\n", fahr, celsius); 


打印 fahr 5 celsius 的 值 ， 这 样 ，fahr 的 值 占 3 个 数字 宽 ，celsius 的 值 占 
6 个 数字 宽 ， 输出 的 结果 如 下 所 示 : 














0 .17 
20 “6 
40 4 

60 15 
80 26 


100 37 


另 一 个 较为 严重 的 问题 是 ， 由 于 我 们 使 用 的 是 整 型 算术 运算 ， 因 此 经 计 
算得 到 的 摄氏 温 度 值 不 太 精 确 ， 例 如 ， 与 ”0F 对 应 的 精确 的 摄氏 温度 
应 该 为 *17.8C， 而 不 是 .17C。 为 了 得 到 更 精确 的 结果 ， 应 该 用 浮 点 算术 
运算 代替 上 面 的 整 型 算术 运算 。 这 就 需要 对 程序 做 适当 修改 。 下 面 是 
该 程序 的 又 一 种 版 本 


#include <stdio.h> 








/* print Fahrenheit*Celsius table 
for fahr = 0, 20, ..., 300; floating*point version */ main() 


{ 


float fahr, celsius; float lower, upper, step; 


lower = 0; /* lower limit of temperatuire scale */ upper = 
300; /* upper limit */ 
step = 20; /* step size */ 


fahr = lower; 
while (fahr <= upper) { 


celsius = (5.0/9.0) * (fahre32.0); printf("%3.0f %6.1f\n", fahr, celsius); fahr = 
fahr + step; 


} 
} 
这 个 程序 与 前 一 个 程序 基本 相同 ， 不 同 的 是 ， 它 把 fahr 与 celsius 声明 


J float 类 型 ， 转 换 公 式 的 表述 方式 也 更 自然 一 些 。 在 前 一 个 程序 中 ， 
之 所 以 不 能 使 用 579 的 形式 ， 








古 因为 按 整 型 除法 的 计算 规则 ， 它 们 相 除 并 舍 位 后 得 到 的 结果 为 0。 但 
是 ， 常 数 中 的 小 数 点 表 明 该 第 数 是 一 个 浮 点 数 ， 因 此 ，5.0 /9.0 是 两 个 
浮 点 数 相 除 ， 结 果 将 不 被 舍 位 。 


如 琳 录 个 算术 运算 符 的 所 有 操作 数 均 为 整 型 ， 则 执行 整 型 运算 。 但 是， 
如 琳 录 个 算术 运 算 符 有 一 个 浮 点 型 操作 数 和 一 个 整 型 操作 数 ， 则 在 开 

始 运 算 之 前 整 型 操作 数 将 会 被 转换 为 浮 点 型 。 例 如 ， 在 表达 式 fahr — 

32 中 ，32 在 运算 过 程 中 将 被 目 动 转换 为 浮 点 数 再 参与 运算 。 不 过 ， 即 
使 浮 点 常量 取 的 是 整 型 值 ， 在 书写 时 最 好 还 是 为 它 加 上 一 个 显 式 的 小 数 
扩 ， 这 样 可 以 强调 其 浮 点 性 质 ， 便 于 阅读 。 


第 2 章 将 详细 介绍 把 整 型 数 转 换 为 浮 点 型 数 的 规则 。 在 这 里 需要 注意 ， 
赋值 语句 


























fahr = lower; 
与 条 件 测试 语句 
while (fahr <= upper) 


也 都 是 按照 这 种 方式 执行 的 ， 即 在 运算 之 前 先 把 int 类 型 的 操作 数 转换 
为 float 类 型 的 操作 数 。 

printf 中 的 转换 说 明 %3.0f 表明 竺 打印 的 浮 点 数 ( 即 fahD 人 至少 占 3 个 字符 
Be» ELAS 融 小 数 点 和 小 数 部 分 ;%6.1f 表明 另 一 个 符 打 印 的 数 (celsius) 至 
少 占 6 个 字符 宽 ， 且 小 数 点 后 面 有 1 工 位 数字 。 其 输出 如 下 所 未 : 


0 °17.8 





20 *6./ 


40 4.4 


格式 说 明 可 以 省 略 宽度 与 精度 ， 例 如 ，9%6f 表示 竺 打印 的 译 点 数 至 少 有 
6 个 字符 宽 ;%.2f 指定 符 打 印 的 译 点 数 的 小 数 点 后 有 两 位 小 数 ， 但 宽度 没 
有 限制 ;%f 则 仅仅 要 求 按照 译 点 数 打 印 该 数 。 





%d 按照 十 进 制 整 型 数 打印 


%6d 按照 十 进 制 整 型 数 打 印 ， 至 少 6 ATI E 

%f 按照 浮 点 数 打印 

9%66f 按照 浮 点 数 打 印 ， 至 少 6 个 字符 宽 

%.2f 按照 浮 点 数 打印 ， 小 数 点 后 有 两 位 小 数 

%6.2f 按照 序 点 数 打印 ， 人 至 少 6 个 字符 宽 ， 小 数 点 后 有 两 位 小 数 


此 外 ，printf 函数 还 文 持 下 列 格式 说 明 :9%o 表示 八进制 数 ;%x 表示 十 六 进 
制 数 ;%c 表示 字符 ;%s RAN FAT BULAN AS (WAZ 


练习 193 修改 温度 转换 程序 ， 使 之 能 在 转换 表 的 顶部 打印 一 个 标 
ie 1°4 编写 一 个 程序 打印 摄氏 温度 转换 为 相应 华氏 温度 的 


1.3 for 语句 


对 于 茶 个 特定 任务 我 们 可 以 采用 多 种 方法 来 编写 程序 。 下 面 这 段 代 码 也 
可 以 实现 前 面 的 温度 转换 程序 的 功能 : 


#include <stdio.h> 














和 # 打 印 华氏 温度 一 摄氏 温度 对 照 表 六 
main() 

{ 

int fahr; 


for (fahr = 0; fahr <= 300; fahr = fahr + 20) printf(""%3d %6.1f\n", fahr, 
(5.0/9.0)*(fahre32)); 


} 


这 个 程序 与 上 市 中 介绍 的 程序 执行 结果 相同 ， 但 程序 本 里 却 有 所 不 同 。 
最 主要 的 改进 在 于 它 去 控 了 大 部 分 变量 ， 而 只 使 用 了 一 个 int 类 型 的 变 
量 fahr。 在 新 引入 的 for 语句 中 ,温度 的 下 限 、 上 限 和 步 长 都 是 常量 ， 
而 计算 拨 氏 温度 的 表达 式 现在 变 成 了 printf 函数 的 第 三 个 参数 ， 它 不 再 
古 一 个 单独 的 赋值 语句 。 


以 上 几 点 改进 中 的 最 后 一 点 是 C 语言 中 一 个 通用 规则 的 实例 :在 允许 使 
用 茶 种 类 型 变量 值 的 任何 场合 ， 部 可 以 使 用 该 类 型 的 更 复杂 的 表达 
式 。 因 为 printf 函数 的 第 三 个 参数 必须 是 与 %6.1f 匹配 的 浮 点 值 ， 所 以 
可 以 在 此 处 使 用 任何 浮 点 表达 式 。 


for 语句 是 一 种 循环 语句 ， 它 是 对 while 语句 的 推广 。 如 果 将 for 语 名 与 
前 面 介绍 的 while 语句 比较 ， 束 会 发 现 for 语句 的 操作 更 直观 一 些 。 攻 
括号 中 共 包 含 3 个 部 分 ， 各 部 分 之 间 用 分 号 隔 开 。 第 一 部 分 

fahr = 0 

是 初始 化 部 分 ， 仅 在 进入 循环 前 执行 一 次 。 第 二 部 分 

fahr <= 300 


是 控制 循环 的 测试 或 条 件 部 分 。 循 环 控制 将 对 该 条 件 求 值 ， 如 果 结 果 值 
为 真 (true)， 则 执行 循环 体 (本 例 中 的 循环 体 仅 包含 一 个 printf 函数 调用 
语句 )。 此 后 将 执行 第 三 部 分 














fahr = fahr + 20 


以 将 循环 变量 fahr 增加 一 个 步 长 ， 并 再 次 对 条 件 求 值 。 如 果 计 算得 到 的 
条 件 值 为 假 (faise)， 循环 将 终止 执行 。 与 while 语句 一 样 ，for 循环 语句 
的 循环 体 可 以 只 有 一 条 语句 ， 也 可 以 是 用 花 括 号 括 起 来 的 一 组 语句 。 
初始 化 部 分 (第 一 部 分 )、 条 件 部 分 (第 二 部 分 ) 与 增加 步 长 部 分 (第 三 部 
分 ) 都 可 以 是 任何 表达 式 。 


在 实际 编程 过 程 中 ， 可 以 选择 while 与 for 中 的 任意 一 种 循环 语句 ， 主 
要 要 看 使 用 哪 一 种 更 清晰 。for 语句 比较 适合 初始 化 和 增加 步 长 都 是 单 
条 语句 并 且 逻 辑 相关 的 情形 ， 因 为 它 将 循环 控制 语句 集中 放 在 一 起 ， 
HEE while 语句 更 紧凑 。 


练习 195 修改 温度 转换 程序 ， 要 求 以 逆序 ( 即 按照 从 300 度 到 0 度 的 顺 
序 ) 打 印 温 度 转 换 表 。 


1.4 7:3 2 


‘9 rh 


在 结束 讨论 温度 转换 程序 前 ， 我 们 再 来 看 一 下 符号 常量 。 在 程序 中 使 用 
300、20 等 类 似 的 " 弥 数 "并 不 是 一 个 好 习惯 ， 它 们 几乎 无 法 癌 以 后 阅读 
该 程序 的 人 提供 什么 信息 ， 而 且 使 程序 的 修改 变 得 更 加 困难 。 处 理 这 
种 约 数 的 一 种 方法 是 赋予 它 们 有 意义 的 名 字 。#efine 指 令 可 以 把 符号 
名 (或 称 为 符号 向量 ) 定 义 为 一 个 特定 的 字符 串 : 























#define 名 字 BLK 

在 该 定义 之 后 ， 程 序 中 出 现 的 所 有 在 #define 中 定义 的 名 字 ( 既 没有 用 引 
号 引起 来 ， 也 不 是 其 它 名 字 的 一 部 分 ) 都 将 用 相应 的 蔡 换文 本 蔡 换 。 其 
中 ， 名 字 与 普通 变量 名 的 形式 相同 : 它 们 都 是 以 字母 打头 的 字母 和 数字 
序列 ; 蔡 换文 本 可 以 是 任何 字符 序列 ， 而 不 仅 限 于 数字 。 


#include <stdio.h> 


LOWER of lower limit of table */ 














UPPER peo upper limit */ 


/* print Fahrenheit*Celsius table */ main() 





{ 


int fahr; 


for (fahr = LOWER; fahr <= UPPER; fahr = fahr + STEP) printf("%3d 
%6.1f\n", fahr, (5.0/9.0)*(fahre32)); 


} 

EH, LOWER, UPPER 5 STEP 都 是 符号 常量 ， 而 非 变量 ， 因 此 不 需 
要 出 现在 声明 中 。 符 号 常量 名 通常 用 大 写字 母 拼写 ， 这 样 可 以 很 容易 
与 用 小 写字 母 拼 写 的 变量 名 相 区 别 。 注 意 ， 


#define 指令 行 的 末尾 没有 分 号 。 

















1.5 字符 输入 /输出 


接 下 来 我 们 看 一 组 与 字符 型 数据 处 理 有 关 的 程序 。 读 者 将 会 发 现 ， 许 多 
程序 只 不 过 是 这 里 所 讨论 的 程序 原型 的 扩充 版 本 而 已 。 


标准 库 提 供 的 输入 /输出 模型 非常 简单 。 无 论文 本 从 何 处 输入 ， 输 出 到 
何 处 ， 其 输入 /输出 都 是 按照 字符 流 的 方式 处 理 。 文 本 流 是 由 多 行 字 符 
构成 的 字符 序列 ， 而 每 行 字符 则 由 0 个 或 多 个 字符 组 成 ， 行 末 是 一 个 换 
行 符 。 标 准 库 负 责 使 每 个 输入 /输出 流 都 能 够 遵守 这 一 模 型 。 使 用 标准 
EH C 语言 程序 员 不 必 关 心 在 程序 之 外 这 些 行 是 如 何 表示 的 。 

标准 库 提 供 了 一 次 恋 / 写 一 个 字符 的 函数 ， 其 中 最 简单 的 是 getchar 和 
putchar 两 个 函数 。 每 次 调用 时 ，getchar 函数 从 文本 流 中 读 入 下 一 个 输 
入 字符 ， 并 将 其 作为 结果 值 返 回 。 也 就 是 说 ， 在 执行 语句 

















c = getchar() 


之 后 ， 变 量 c HURL ATEN BOE OE EH eH E 
盘 和 输入 的 。 关 于 从 文 件 输入 字符 的 方法 ， 我 们 将 在 第 7 章 中 讨论 。 


每 次 调用 putchar 函数 时 将 打印 一 个 字符 。 例 如 ， 语 名 
putchar() 


将 把 整 型 变量 c 的 内 容 以 字符 的 形式 打印 出 来 ， 通 常 是 显示 在 屏幕 上 。 
putchar 与 printf 


这 两 个 函数 可 以 交 葵 调用 ， 和 输出 的 次 序 与 调用 的 次 序 一 致 。 








1.5.1. 文件 复制 


借助 于 getchar 与 putchar 函数 ， 可 以 在 不 了 解 其 它 输入 /输出 知识 的 情 
况 下 编写 出 数量 惊人 的 有 用 的 代码 。 最 简单 的 例子 就 是 把 输入 一 次 一 
个 字符 地 复制 到 输出 ， 其 基本 思想 如 下 : 


Py Aly 


读 一 个 字符 





whi l e (该 字符 不 是 文件 结束 指示 符 ) 
输出 刚 读 入 的 字符 

DFTA 

将 上 述 基本 思想 转换 为 C 语言 程序 为 : 
#include <stdio.h> 

/* copy input to output; 1st version */ main() 
{ 

int c; 

c= getchar(); while (c != EOF) { 
putchar(c); 

c = getchar(); 

} 

} 


其 中 ， 关 系 运算 符 != 表 示 " 不 等 于 "。 字符 在 键盘 、 屏 幕 或 其 它 的 任何 地 
方 无 论 以 什么 形式 表现 ， 它 在 机 器 内 部 部 是 以 位 模式 


存储 的 。char 类 型 专门 用 于 存储 这 种 字符 型 数据 ， 当 然 任何 整 型 inb 也 














可 以 用 于 存储 字 
符 型 数据 。 因 为 茶 些 潜在 的 重要 原因 ， 我 们 在 此 使 用 int 类 型 。 


这 里 需要 解决 如 何 区 分 文件 中 有 效 数 据 与 输入 结束 符 的 问题 。C 语言 条 
取 的 解决 方法 是 : 在 没有 输入 时 ，getchar 函数 将 返回 一 个 特殊 值 ， 这 个 
特殊 值 与 任何 实际 字符 都 不 同 。 这 个 值 称 为 EOF(end of file， 文 件 结 
束 )。 我 们 在 声明 变量 c 的 时 候 ， 必 须 让 它 大 到 足以 存 放 getchar 函数 返 
回 的 任何 值 。 这 里 之 所 以 不 把 c 声 明成 char 类 型 ， 是 因为 它 必须 足够 
大 ， 除 了 能 存储 任何 可 能 的 字符 外 还 要 能 存储 文件 结束 符 EOF. [Al 
此 ， 我 们 将 c 声明 成 int 类 型 。 

EOF 定义 在 头 文件 <stdio.h> 中 ， 是 个 整 型 数 ， 其 具体 数值 是 什么 并 不 重 
要 ， 只 要 它 与 任何 char 类 型 的 值 都 不 相同 即 可 。 这 里 使 用 符号 常量 ， 
可 以 确保 程序 不 需要 依赖 于 其 对 应 的 任何 特定 的 数值 。 


对 于 经 验 比较 丰富 的 C 语言 程序 员 ， 可 以 把 这 个 字符 复制 程序 编写 得 更 
精炼 一 些 。 在 C 


wat, RUF 











c = getchar() 


之 类 的 赋值 操作 是 一 个 表达 式 ， 并 且 具 有 一 个 值 ， 即 赋值 后 左边 变量 保 
存 的 值 。 也 惑 是 说 ， 赋值 可 以 作为 更 大 的 表达 式 的 一 部 分 出 现 。 如 果 
将 为 c 赋 值 的 操作 放 在 while 循环 语句 的 测 试 部 分 中 ， 上 述 字符 复制 程 
序 便 可 以 改写 成 下 列 形式 : 


/* copy input to output; 2nd version */ main() 

{ 

int c; 

while ((c = getchar()) != EOF) putchar(c); 

} 

在 该 程序 中 ，while 循环 语句 首先 读 一 个 字符 并 将 其 赋值 给 c， 然 后 测试 
该 字符 是 否 为 文件 结束 标志 。 如 果 该 字符 不 是 文件 结束 标志 ， 则 执行 


while 语句 体 ， 并 打印 该 字符 。 随 后 重复 执行 while 语句 。 当 到 达 输 入 
的 结尾 位 置 时 ，while 循环 语句 终止 执行 ， 从 而 整个 main K 数 执行 结 
Wo 








以 上 这 段 程序 将 输入 集中 化 ，getchar 函数 在 程序 中 只 出 现 了 一 次 ， 这 样 
WM SRE, 整个 程序 看 起 来 更 紧凑 。 习 惯 这 种 风格 后 ， 读 者 就 会 
发 现 按 照 这 种 方式 编写 的 程序 更 易 疯 读 。 我 们 经 常会 看 到 这 种 风格 。 
(不 过 ， 如 果 我 们 过 多 地 使 用 这 种 类 型 的 复杂 语句 ， 编 写 的 程序 可 能 会 
很 难 理解 ， 应 尽量 避免 这 种 情况 。) 


对 while 语句 的 条 件 部 分 来 说， 赋值 表达 式 两 边 的 圆 括号 不 能 和 省略。 不 
等 于 运算 符 != 的 优先 级 比 赋值 运算 符 = 的 优先 级 要 高 ， 这 样 ， 在 不 使 用 
圆 括号 的 情况 下 关系 测试 != 将 在 赋值 = 操作 之 前 执行 。 因 此 语句 

c= getchar() != EOF 

等 价 于 语句 

c = (getchar() != EOF) 

该 语句 执行 后 ，c 的 值 将 被 置 为 0 或 1( 取 决 于 调用 getchar 函数 时 是 否 
人 磁 到 文件 结束 标志 )， 这 并 不 是 我 们 所 希望 的 结果 (更 详细 的 内 容 ， 请 参 
见 第 2 章 的 相关 部 分 )。 


练习 1°6 验证 表达 式 getchar() != EOF 的 值 是 0 还 是 1。 练习 
1°7 编写 一 个 打印 EOF 值 的 程序 。 











1.5.2. 字符 计数 
下 列 程序 用 于 对 字符 进行 计数 ， 它 与 上 面 的 复制 程序 类 似 。 
#include <stdio.h> 
/* count characters in input; 1st version */ main() 
{ 
long nc; 
nc = 0; 
while (getchar() != EOF) 
++nc; printf("%ld\n", nc); 
} 
其 中 ， 语 句 


++nc; 


引入 了 一 个 新 的 运算 符 ++， 其 功能 是 执行 加 工 操 作 。 可 以 用 语句 nc = 
nc+14t#C, (8 语句 ++nc 更 精炼 一 些 ， 晶 通常 效率 也 更 高 。 与 该 运 
算 符 相应 的 是 自 减 运算 符 。。++ 与 这 两 个 运算 符 既 可 以 作为 前 级 运算 
符 ( 如 ++ncj， 也 可 以 作为 后 缀 运算 符 ( 如 nc++)。 我 们 在 第 2 章 中 将 
看 到 ， 这 两 种 形式 在 表达 式 中 具有 不 同 的 值 ， 但 ++nc 与 nc++ 都 使 nc 的 
值 增 加 1。 目前 ， 我 们 只 使 用 前 绥 形 式 。 


该 字符 计数 程序 使 用 long 类 型 的 变量 存放 计数 值 ， 而 没有 使 用 int 类 型 
HEE. long 整 型 数 (长 整 型 ) 至 少 要 占用 32 位 存储 单元 。 在 某 些 机 器 上 
int 与 long 类 型 的 长 度 相 同 ， 但 在 一 些 机 器 上 ，int 类 型 的 值 可 能 只 有 
16 位 存储 单元 的 长 度 ( 最 大 值 为 32767)， 这 样 ， 相 当 小 的 输入 都 可 能 使 
int 类 型 的 计数 变量 溢出 。 转 换 说 明 %ld 告诉 printf 函数 其 对 应 的 参 数 是 


long 整 型 。 


使 用 double( 双 精度 浮 点 数 ) 类 型 可 以 处 理 更 大 的 数字 。 我 们 在 这 里 不 使 
用 while 循 环 语句 ， 而 用 for 循环 语句 来 展示 编写 此 循环 的 另 一 种 方法 : 


#include <stdio.h> 





/* count characters in input; 2nd version */ main() 
{ 
double nc; 


for (nc = 0; gechar() != EOF; ++nc) 


printf("%.0f\n", nc); 
} 


对 于 float 与 double 类 型 。printf 函数 都 使 用 %f 进行 说 明 。%.0f 强制 不 
打印 小 数 点 和 小 数 部 分 ， 因 此 小 数 部 分 的 位 数 为 0。 


在 该 程序 段 中 ，for 循环 语句 的 循环 体 是 空 的 ， 这 是 因为 所 有 工作 都 在 
测试 (条 件 ) 部 分 与 增加 步 长 部 分 完成 了 。 但 C 语言 的 语法 规则 要 求 for 
循环 语句 必须 有 一 个 循环 体 ， 因 此 用 单独 的 分 写 代 丛 。 单 独 的 分 号 称 
a 它 正好 能 满足 for 语句 的 这 一 要 求 。 把 它 单 独 放 在 一 行 是 为 
了 更 加 醒目 。 


在 结束 讨论 字符 计数 程序 之 前 ， 我 们 考虑 以 下 情况 :如 果 输 入 中 不 包含 
F, MWA, Æ 第 一 次 调用 getchar KIIR, while 语句 或 for 语句 
中 的 条 件 测 试 从 一 开始 束 为 假 ， 程序 的 执行 结果 将 为 0， 这 也 是 正确 的 
结果 。 这 一 点 很 重要 。while 语句 与 for 语句 的 优点 之 一 就 是 在 执行 循 
环 体 之 前 就 对 条 件 进 行 测 试 ， 如 有 果 条 件 不 满足 ， 则 不 执行 循环 体 ， 这 就 
可 能 出 现 循环 体 一 次 都 不 执行 的 情况 。 在 出 现 0 长 度 的 输入 时 ， 程 序 
的 处 理应 该 灵活 一 些 ， 在 出 现 边界 条 件 时 ，while 语句 与 for 语句 有 助 
于 确保 程序 执行 合理 的 操作 。 


1.5.3. 行 计 数 
接 下 来 的 这 个 程序 用 于 统计 输入 中 的 行 数 。 我 们 在 上 面 提 到 过 ， 标 准 库 


保证 输入 文本 流 以 行 序列 的 形式 出 现 ， 每 一 行 均 以 换行 符 结束 。 
此 ， 统 计 行 数 等 价 于 统计 换行 符 的 个 数 。 











/* count lines in input */ main() 


{ 
int c, nl; 
nl=0 


while ((c = getchar()) != EOF) if (c == n’) 
++nl; printf("%d\n", nl); 
} 


在 该 程序 中 ，while 循环 语句 的 循环 体 是 一 个 站 语句 ， 它 控制 自 增 语句 
++nl。 半 语句 先 测 试 圆 括 写 中 的 条 件 ， 如 果 该 条 件 为 真 ， 则 执行 其 后 的 
人 
控制 关系 。 


双 等 于 号 == 是 C 语言 中 表示 "等 于 "关系 的 运算 符 (类 似 于 Pascal 中 的 单 
等 于 号 = 及 Fortran 中 的 .EQ.)。 由 于 C 语言 将 单 等 于 号 = 作为 赋值 运算 
符 ， 因 此 使 用 双 等 于 号 == 表 示 相 等 的 逻辑 关系 ， 以 示 区 分 。 这 里 提醒 
注意 ， 在 表示 "等 于 "逻辑 关系 的 时 候 (应 该 用 ==)，C 语言 初学 者 有 时 会 
错误 地 写成 单 等 于 号 =。 在 第 2 章 我 们 将 看 到 ， 即 使 这 样 误 用 了 ， 其 结 
果 通 党 仍然 是 合法 的 表达 式 ， 因 此 系统 不 会 给 出 警告 信息 。 


单 引 号 中 的 字符 表示 一 个 整 型 值 ， 该 值 等 于 此 字符 在 机 器 字符 集中 对 应 
的 数值 ， 我 们 称 之 为 字符 常量 。 但 是 ， 它 只 不 过 是 小 的 整 型 数 的 另 一 
种 写法 而 已 。 例 如 ，'A' 是 一 个 字符 常量 ; 在 ASCII 字符 集中 其 值 为 
65( 即 字符 A 的 内 部 表示 值 为 65)。 当 然 ， 用 'A' 要 比 用 65 好 ， 

为 。'A' 的 意义 更 清楚 ， 且 与 特定 的 字符 集 无 关 。 


字符 串 常 量 中 使 用 的 转 义 字符 序列 也 是 合法 的 字符 常量 ， 比 如 ，"\n' 代 表 
换行 符 的 值 ， 在 ASCI 字符 集中 其 值 为 10。 我 们 应 当 注 意 到 ，"\n' 是 单 
个 字符 ， 在 表达 式 中 它 不 过 是 一 个 整 型 数 而 已 ;而 "\n" 是 一 个 仪 包含 一 个 
字符 的 字符 串 和 常量 。 有 关 字 符 串 与 字符 之 间 的 关系 ， 我们 将 在 第 2 Ht 
进一步 讨论 。 















































练习 1°8 编写 一 个 统计 空格 、 制 表 符 与 换行 符 个 数 的 程序 。 
练习 1°9 编写 一 个 将 输入 复制 到 输出 的 程序 ， 并 将 其 中 连续 的 多 个 空格 
用 一 个 空格 代 蔡 。 

练习 1°10 编写 一 个 将 输入 复制 到 输出 的 程序 ， 并 将 其 中 的 制 表 符 蔡 换 
为 \， 把 回 退 符 替换 为 b， 把 反 斜 杠 替 按 为 \。 这 样 可 以 将 制 表 符 和 回 退 
符 以 可 见 的 方式 显示 出 来 。 

1.5.4. 单词 计数 

我 们 将 介绍 的 第 4 个 实用 程序 用 于 统计 行 数 、 单 词 数 与 字符 数 。 这 里 对 


单词 的 定义 比较 宽松 ， 它 是 任何 其 中 不 包含 空格 、 制 表 符 或 换行 符 的 
字符 序列 。 下 面 这 段 程序 是 UNIX 系统 中 we 程序 的 骨干 部 分 : 








#include <stdio.h> 


#define IN 1 /* inside a word */ 


#define OUT 0 /* outside a word */ 


/* count lines, words, and characters in input */ main() 

{ 

int c, nl, nw, nc, state; 

state = OUT; 

nl = nw =nc=0; 

while ((c = getchar()) != EOF) { 

++0C; 

if (c == 'n’) 

++nl; 

if (c == '' || c == ^n' || c = ^t’) state = OUT; 

else if (state == OUT) { state = IN; 

++nw; 

} 

} 

printf("%d %d %d\n", nl, nw, nc); 

} 

程序 执行 时 ， 每 当 过 到 单词 的 第 一 个 字符 ， 它 就 作为 一 个 新 单词 加 以 统 
it. state 变量 记录 程序 当前 是 否 正 位 于 一 个 单词 之 中 ， 它 的 初 值 是 "不 
在 单词 中 "， 即 初 值 被 赋 为 OUT。 我 们 在 这 里 使 用 了 符号 常量 IN 与 
OUT， 而 没有 使 用 其 对 应 的 数值 1 与 0， 这 样 程序 更 易 读 。 在 较 小 的 程 


序 中 ， 这 种 做 法 也 许 看 不 出 有 什么 优势 ， 但 在 较 大 的 程序 中 ， 如 有 果 从 一 
开始 就 这 样 做 ， 因 此 而 增加 的 一 点 工作 量 与 提高 程序 可 读 性 带 来 的 好 











处 相 比 是 值得 的 。 读 者 也 会 及 现 ， 如 宋 程 序 中 的 约 数 都 以 符号 常量 的 
形式 出 现 ， 对 程序 进行 大 量 修改 就 会 相对 容易 得 多 。 


下 列 语 名 





nl = nw =nc=0; 


将 把 其 中 的 3 个 变量 ml、nw 与 nc 部 设置 为 0。 这 种 用 法 很 常见 ， 但 要 
注意 这 样 一 个 事实 : 在 兼 有 值 与 赋值 两 种 功能 的 表达 式 中 ， 赋 值 结 合 次 
序 是 由 右 至 左 。 所 以 上 面 这 条 语句 等 同 于 


nl = (nw = (nc = 0)); 
运算 符 || 代 表 OR( 逻 辑 或 )， 所 以 下 列 语句 
if (c == '' || c== An || c == AN) 


的 意义 是 "如 果 c 是 空格 ， 或 c 是 换行 符 ， 或 c 是 制 表 符 "( 前 面 讲 过 ， 转 
义 字 符 序 列 \t 是 制 表 符 的 可 见 表示 形式 )。 相 应 地 ， 运 算 符 && 代表 
AND( 逻 辑 与 )， 它 仅 比 | 高 一 个 优先 级 。 由 &&& 或 | 连接 的 表达 式 由 左 至 
右 求 值 ， 并 保证 在 求 值 过 程 中 只 要 能 够 判断 最 终 的 结果 为 真 或 假 ， 求 
值 就 立即 终止 。 如 果 c 是 空格 ， 则 没有 必要 再 测试 它 是 人 否 为 换行 符 或 制 
表 符 ， 这 样 就 不 必 执 行 后 面 两 个 测试 。 在 这 里 ， 这 一 点 并 不 特别 重 
OO vn 
这 种 例子 。 


这 段 程序 中 还 包括 一 个 else 部 分 ， 它 指定 当主 语句 中 的 条 件 部 分 为 假 时 
所 要 执行 的 动作 。 其 一 般 形式 为 : 


if (表述 式 ) 


iA) 1 





























else 


eA) 2 


其 中 ，ifeelse 中 的 两 条 语句 有 且 仅 有 一 条 语句 航 执 行 。 如 末 表 达 式 的 值 
为 真 ， 则 执行 语句 1， 否 则 执行 语句 2。 这 两 条 语句 都 既 可 以 是 单条 语 
句 ， 也 可 以 是 括 在 花 括 号 内 的 语句 序 列 。 在 单词 计数 程序 中 ，else 之 后 
的 语句 仍 是 一 个 过 语句 ， 该 过 语句 控制 了 包含 在 花 括 号 内 的 两 条 语 


句 。 


练习 1911 你 准备 如 何 测 试 单词 计数 程序 ?如 采 程 序 中 存在 茶 种 错误 ， 那 
么 什么 样 的 输 入 最 可 能 发 现 这 类 错误 了 昵 ， 














练习 1.12 编写 一 个 程序 ， 以 每 行 一 个 单词 的 形式 打印 其 输入 。 
1.6 数组 





在 这 部 分 内 容 中 ， 我 们 来 编写 一 个 程序 ， 以 统计 各 个 数字 、 空 日 符 ( 包 
括 空 格 符 、 制 表 符 及 换行 符 ) 以 及 所 有 其 它 字 符 出 现 的 次 数 。 这 个 程序 
的 实用 意义 并 不 大 ， 但 我 们 可 以 通过 该 程序 讨论 C 语言 多 方面 的 问 


je 


所 有 的 输入 字符 可 以 分 成 12 类 ， 因 此 可 以 用 一 个 数组 存放 各 个 数字 出 
现 的 次 数 ， 这 样 比 


使 用 10 个 独立 的 变量 更 方便 。 下 面 是 该 程序 的 一 种 版 本 : 
#include <stdio.h> 

/* count digits, white space, others */ main() 

{ 

int c, i, nwhite, nother; int ndigit[10]; 

nwhite = nother = 0; 

for (i = 0; i < 10; ++i) ndigit[i] = 0; 

while ((c = getchar()) != EOF) if (c >= '0' && c <= '9') 


++ndigit[ce'0']; 


else if (c == '' || c == An || c == ^t’) 

++nwhite; else 

++nother; 

printf("digits ="); 

for (i = 0; i < 10; ++i) printf(" %d", ndigit[i]); 

printf(", white space = %d, other = %d\n"", nwhite, nother); 
} 

当 把 这 段 程序 本 喘 作 为 输入 时 ， 和 输出 结果 为 : 

digits = 9300000001, white space = 123, other = 345 
该 程序 中 的 声明 语句 

int ndigit[10]， 


将 变量 ndigit 声明 为 由 10 个 整 型 数 构成 的 数组 。 在 C 语言 中 ， 数 组 下 
标 总 是 从 0 开始 ， 


此 该 数组 的 10 个 元 素 分 别 为 ndigit[0]、ndiglt[1]、 、ndigit[9]， 这 可 以 
通过 初始 化 和 打印 数组 的 两 个 for 循环 语句 反映 出 来 。 


数组 下 标 可 以 是 任何 整 型 表达 式 ， 包 括 整 型 变量 (如 iD 以 及 整 型 常量 。 
该 程序 的 执行 取决 于 数字 的 字符 表示 属性 。 例 如 ， 测 试 语句 


if (c >= '0' && c <= '9') 
用 于 判断 c 中 的 字符 是 否 为 数字 。 如 果 和 它 是 数字 ， 那 么 该 数字 对 应 的 数 


值 是 











只 有 当 '0'、'1'、、'9' 具 有 连续 递增 的 值 时 ， 这 种 做 法 才 可 行 。 幸 运 的 
是 ， 所 有 的 字符 集 都 是 这 样 的 。 

由 定义 可 知 ，char 类 型 的 字符 是 小 整 型 ， 因 此 char 类 型 的 变量 和 常量 在 
算术 表达 式 中 等 价 于 int 类 型 的 变量 和 常量 。 这 样 做 既 自 然 义 方便 ， 例 
如 ，c。'0' 是 一 个 整 型 表达 式 ， 如 果 存 储 在 c 中 的 字符 是 '0'r9'"， 其 值 将 
为 09， 因 此 可 以 充当 数组 ndigit 的 合法 下 tr. 

判断 一 个 字符 是 数字 、 空 白 符 还 是 其 它 字符 的 功能 可 以 由 下 列 语句 序列 
完成 : 


if (c >= '0' && c <= '9') 








++ndigit[ce'0']; 

else if (c =='' || c == ‘\n' || c == At) 
++nwhite; else 

++nother; 

程序 中 经 常 使 用 下 列 方式 表示 多 路 判定 : 


if (条 件 1) 


语句 1 
else if (条 件 1) 


ie A) 2 


else 
语句 mn 


在 这 种 方式 中 ， 各 条 件 从 前 往 后 依次 求 值 ， 直 到 满足 茶 个 条 件 ， 然 后 执 
行 对 应 的 语句 部 分 。 这 部 分 语句 执行 完成 后 ， 整 个 语句 体 执行 结束 (其 
中 的 任何 语句 都 可 以 是 括 在 花 括号 中 的 知 干 条 语句 )。 如 果 所 有 条 件 都 
不 满足 ， 则 执行 位 于 最 后 一 个 else 之 后 的 语句 (如 果 有 的 话 )。 类 似 于 前 
面 的 单词 计数 程序 ， 如 果 没 有 最 后 一 个 else 及 对 应 的 语句 ， 该 语句 体 将 
不 执行 任何 动作 。 在 第 一 个 站 与 最 后 一 个 else 之 间 可 以 有 0 个 或 多 个 
下 列 形式 的 语句 序列 : 


else if (条 件 ) 

语句 

就 程序 设计 风格 而 言 ， 我 们 建议 读者 采用 上 面 所 示 的 缩 进 格式 以 体现 该 
结构 的 层次 关系 ， 人 否则， 如 果 每 个 话 都 比 前 一 个 else 向 里 缩 进 一 些 距 
离 ， 那 么 较 长 的 判定 序列 就 可 能 超出 页 面 的 右边 界 。 

第 3 章 将 讨论 的 switch 语句 提供 了 编写 多 路 分 文 程序 的 为 一 种 方式 ， 它 


特别 适合 于 判 定 某 个 整 型 或 字符 表达 式 是 否 与 一 个 常量 集合 中 的 某 个 
元 素 相 匹配 的 情况 。 我 们 将 在 3.4 TA 


























出 用 switch 语句 编写 的 该 程序 的 另 一 个 版 本 ， 与 此 进行 比较 。 


练习 1913 编写 一 个 程序 ， 打 印 输入 中 单词 长 度 的 直方 图 。 水 平方 同 的 
直方 图 比较 容易 绘制 ， 垂 直方 同 的 直方 图 则 要 困难 些 。 


练习 1.14 编写 一 个 程序 ， 打 印 输入 中 各 个 字符 出 现 频 度 的 直方 
图 。 
1.7 函数 


C 语言 中 的 函数 等 价 于 Fortran 语言 中 的 子 程序 或 函数 ， 也 等 价 于 Pascal 
语言 中 的 过 程 或 函数。 函数 为 计算 的 封装 提供 了 一 种 简便 的 方法 ， 此 
后 使 用 函数 时 不 需要 考虑 它 是 如 何 实现 的 。 使 用 设计 正确 的 函数 ， 程 
序 员 无 需 考虑 功能 是 如 何 实现 的 ， 而 只 需 知 道 它 具有 哪些 功能 就 够 

了 。 在 C 语言 中 可 以 简单 、 方 便 、 高 效 地 使 用 函数 。 我 们 经 常会 看 到 在 
定义 后 仪 调用 了 一 次 的 短 函 数 ， 这 样 做 可 以 使 代码 段 更 清晰 易 读 。 


到 目前 为 止 ， 我 们 所 使 用 的 函数 (如 printf、getchar 和 putchar 等 ) 都 是 函 
数 库 中 提供 的 函数 。 现 在 ， 让 我 们 上 自己 动手 来 编写 一 些 函 数 。C 语言 没 
AYR Fortran 语言 一 样 提供 类 似 于 ** 的 求 军 运算 符 ， 我 们 现在 通过 编写 
一 个 求 盏 的 函数 power(m, nÆ WH RAŽE X 的 方法 。power(m, n) 函 数 
用 于 计算 整数 m 的 n KE, HE n 是正 整数 。 对 函数 调用 power(2, 5) 来 
说 ， 其 结果 值 为 32。 该 函数 并 非 一 个 实用 的 求 军 函 数 ， 它 只 能 处 理 较 
小 的 整数 的 正 整 数 次 军 ， 但 这 对 于 说 明 问 题 已 足够 了 。( 标 准 库 中 提供 
了 一 个 计算 x* 的 函数 pow(x, y)。) 


下 面 是 函数 power(m, n) 的 定义 及 调用 它 的 主 程序 ， 这 样 我 们 可 以 看 到 一 
个 完整 的 程序 结构 。 


#include <stdio.h> 














int power(int m, int n); 
/* test power function */ main() 


{ 


int 1; 

for (i = 0; i < 10; ++i) 

printf("%d %d %d\n", i, power(2,i), power(*3,i)); return 0; 

} 

/* power: raise base to neth power; n >= 0 */ int power(int base, int n) 
{ 

int 1, p; 

p=]; 

for (i = 1; i<=n; ++i) p = p * base; 


return p; 


~ 


函数 定义 的 一 般 形式 为 : 
返回 值 类 型 函数 名 (0 个 或 多 个 参数 声明 ) 





{ 

声明 部 分 

语句 序列 

} 

函数 定义 可 以 以 任意 次 序 出 现在 一 个 源 文件 或 多 个 源 文 件 中 ， 但 同一 函 

数 不 能 分 割 存 放 在 多 个 文件 中 。 如 果 源 程序 分 散在 多 个 文件 中 ， 那 

么 ， 在 编译 和 加 载 时 ， 就 需要 做 更 多 的 工作， 但 这 是 操作 系统 的 原 

因 ， 并 不 是 语言 的 属性 决定 的 。 我 们 和 暂且 假定 将 main 和 power 这 两 个 

同一 文件 中 ， 这 样 前 面 所 学 的 有 关 运 行 C 语言 程序 的 知识 仍然 
XX o 

main 函数 在 下 列 语句 中 调用 了 两 次 power 函数 : 

printf("%d %d %d\n", i, power(2, i), power(*i, 3)); 

每 次 调用 时 ，main 函数 癌 power 函数 传递 两 个 参数 ;在 调用 执行 完成 

IN, power Kta main 函数 返回 一 个 格式 化 的 整数 并 打印 。 在 表达 式 

中 ，power(2, iD 同 2 和 i 一 样 都 是 整数 (并 不 是 所 有 函数 的 结果 都 是 整 型 

值 ， 我 们 将 在 第 4 章 中 讨论 )。 


power 函数 的 第 一 行 语 名 











int power(int base, int n) 


声明 参数 的 类 型 、 名 字 以 及 该 函数 返回 结果 的 类 型 。power 函数 的 参数 
使 用 的 名 字 只 在 power 函数 内 部 有 效 ， 对 其 它 任何 函数 都 是 不 可 见 的 : 
其 它 函 数 可 以 使 用 与 之 相同 的 参数 名 字 而 不 会 引起 冲突 。 变 量 i 与 p 也 
是 这 样 :power 函数 中 的 i 与 main 函数 中 的 i 无 关 。 


我 们 通常 把 函数 定义 中 国 括 写 内 列表 中 出 现 的 变量 称 为 形式 参数 ， 而 把 
函数 调用 中 与 形 式 参数 对 应 的 值 称 为 实际 参数 。 


power 函数 计算 所 得 的 结果 通过 return 语句 返回 给 main 函数 。 关 键 字 
return 的 后 面 可 以 跟 任何 表达 式 ， 形 式 为 : 











return 表达 式 ; 


函数 不 一 定 都 有 返回 值 。 不 融 表 达 式 的 return 语句 将 把 控制 权 返 回 给 调 
用 者 ， 但 不 返回 有 用 的 值 。 这 等 同 于 在 到 达 函 数 的 右 终 结 花 括号 时 ， 
函数 就 "到 达 了 尽头 "。 主 调 函 数 也 可 以 名 略 函数 返回 的 值 。 


读者 可 能 已 经 注意 到 ，main 函数 的 末尾 有 一 个 return 语句 。 由 于 main 
本 喘 也 是 函数 ， 因此 也 可 以 癌 其 调用 者 返回 一 个 值 ， 该 调用 者 实际 上 
Whe Ree SUT. MOR, (KI 值 为 0 表示 正常 终止 ,返回 值 
为 非 0 表示 出 现 异 常情 况 或 出 错 结束 条 件 。 为 简洁 起 见 ， 前 面 的 main 
函数 都 省 略 了 return 语句 ， 但 我 们 将 在 以 后 的 main 函数 中 包含 return 
语句 ， 以 提醒 大 家 注意 ， 程 序 还 要 问 其 执行 环境 返回 状态 。 


出 现在 main 函数 之 前 的 声明 语句 











int power(int m, int n); 

表明 power 函数 有 两 个 int 类 型 的 参数 ， 并 返回 一 个 int 类 型 的 值 。 这 种 
声明 称 为 函数 原 型 ， 它 必须 与 power KAHI EMA Be. RK 
数 的 定义 、 用 法 与 函数 原型 不 一 致 ， 将 出 现 错误 。 


函数 原型 与 尔 数 声明 中 参数 名 不 要 求 相同 。 事 实 上 ， 函 数 原型 中 的 参数 
名 是 可 选 的 ， 这 样 上 面 的 函数 原型 也 可 以 写成 以 下 形式 





int power(int, int); 


但 是 ， 合 适 的 参数 名 能 够 起 到 很 好 的 说 明 性 作用 ， 因 此 我 们 在 函数 原型 
中 忆 古 指明 参数 名 。 


回顾 一 下 ，ANSIC 同 较 富 版 本 C 语言 之 间 的 最 大 区 列 在 于 函数 的 声明 

与 定义 方式 的 不 同 。 按照 C 语言 的 最 初 定义 ，power 函数 应 该 写成 下 列 
形式 : 

/* power: raise base to neth power; n >= 0 */ 

/* (oldestyle version) */ power(base, n) 

int base, n; 

{ 

int i, p; 

p=; 

for (i = 1; i <= n; ++i) p = p * base; 

retum p; 

} 

其 中 ， 参 数 名 在 圆 括 号 内 指定 ， 参 数 类 型 在 左 花 括号 之 前 声明 。 如 采 没 
J 数 的 类 型 ， 则 默认 为 int 类型。 函数 体 与 ANSIC 中 形式 


在 C 语言 的 最 初 定 义 中 ， 可 以 在 程序 的 开头 按照 下 面 这 种 形式 声明 
power 函数 : 








int power(); 


冰 数 声明 中 不 允许 包 合 参数 列表 ， 这 样 编译 器 就 无 法 在 此 时 检查 a 
函数 调用 的 合法 性 。 事实 上 ，power 函数 在 默认 情况 下 将 被 假定 返 


int 类 型 的 值 ， 因 此 整个 函数 的 声明 可 以 全 部 省 略 。 


在 ANSI C 中 定义 的 函数 原型 语法 中 ， 编 译 器 可 以 很 容易 检测 出 函数 调 
用 中 参数 数目 和 类 型 方面 的 错误 。ANSI C 仍然 支持 旧式 的 函数 声明 与 
定义 ， 这 样 至 少 可 以 有 一 个 过 小 阶段 。 但 我 们 还 是 强烈 建议 读者 :在 使 
用 新 式 的 编译 右 时 ， 最 好 使 用 新 式 的 函数 原型 声明 方式 。 


练习 1°15 重新 编写 1.2 市 中 的 温度 转换 程序 ， 使 用 函数 实现 温度 
转换 计算 。 


1.8 参数 一 一 传 值 调用 


习惯 其 它 语言 (特别 是 Fortran 语言 ) 的 程序 员 可 能 会 对 C 语言 的 函数 参 
数 传递 方式 感到 阳 生 。 在 C 语言 中 ， 所 有 函数 参数 都 是 "通过 值 " 传 递 
的 。 也 就 是 说 ， 传 递 给 被 调用 函数 的 参数 值 存 放 在 临时 变量 中 ， 而 不 
征 存 放 在 原来 的 变量 中 。 这 与 其 它 东 些 语言 是 不 同 的 ， 比 如 ， Fortran 
等 语言 是 "通过 引用 调用 "，Pascal 则 采用 var 参数 的 方式 ， 在 这 些 语言 
中 ， 被 调用 的 函数 必须 访问 原始 参数 ， 而 不 是 访问 参数 的 本 地 副本 。 


最 主要 的 区 别 在 于 ， 在 C 语言 中 ， 被 调用 函数 不 能 直接 修改 主 调 函 数 中 
变量 的 值 ， 而 只 能 修改 其 私有 的 临时 副本 的 值 。 


传 值 调用 的 利 大 于 束 。 在 被 调用 函数 中 ， 参 数 可 以 看 作 是 便于 初始 化 的 
局 部 变量 ， 因 此 额外 使 用 的 变量 更 少 。 这 样 程序 可 以 更 紧凑 简洁 。 侧 
如 ， 下 面 的 这 个 power 函数 利用 了 这 一 性 质 : 




















/* power: raise base to neth power; n >= 0; version 2 */ int power(int 
base, int n) 


{ 

int p; 

for (p = 1; n > 0; *en) p = p * base; 

return p; 

} 

H+, Bin 用 作 临 时 变量 ， 并 通过 随后 执行 的 for 循环 语句 递减 ， 直 
到 其 值 为 0， 这 样 就 不 需要 额外 引入 变量 ipower 函数 内 部 对 n 的 任何 
操作 不 会 影响 到 调用 函数 中 nn 的 原始 参 数值 。 

必要 时 ， 也 可 以 让 函数 能 够 修改 主 调 函 数 中 的 变量 。 这 种 情况 下 ， 调 用 
者 需要 回 被 调用 函数 提供 竺 设置 值 的 变量 的 地 址 (从 搁 术 角度 看 ， 地 址 
束 是 指 癌 变量 的 指针 )， 而 被 调用 函数 则 需要 将 对 应 的 参数 声明 为 指针 
类 型 ， 并 通过 它 间接 访问 变量 。 我 们 将 在 第 5 章 中 讨论 指针 。 

如 果 是 数组 参数 ， 情 况 就 有 所 不 同 了 。 当 把 数组 名 用 作 人 参数 时 ， 传 递 给 
函数 的 值 是 数组 起 始 元 又 的 位 置 或 地 址 一 一 它 并 不 复制 数组 元 素 本 
身 。 在 被 调用 函数 中 ， 可 以 通过 数组 下 标 访问 或 修改 数组 元 索 的 值 。 
这 是 下 一 节 将 要 讨论 的 问题 。 

1.9 字符 数组 

字符 数组 是 C 语言 中 最 常用 的 数组 类 型 。 下 面 我 们 通过 编写 一 个 程序 ， 
来 说 明 字 符 数组 以 及 操作 字符 数组 的 函数 的 用 法 。 该 程序 读 入 一 组 文 
本 行 ， 并 把 最 长 的 文本 行 打印 出 来 。 该 算法 的 基本 框 、 非 常 简单 : 
while (还 有 未 处 理 的 行 ) 


if (该 行 比 己 处 理 的 最 长 行 还 要 长 ) 


























保存 该 行为 最 长 行 
保存 该 行 的 长 度 
打印 最 长 的 行 


从 上 面 的 框 、 中 很 容易 看 出 ， 程 序 很 目 然 地 分 成 了 在 干 片断 ， 分 别 用 于 
ABT. WA 的 行 、 保 存 该 行 ， 其 余部 分 则 控制 这 一 过 程 。 


因为 这 种 划分 方式 比较 合理 ， 所 以 可 以 按照 这 种 方式 编写 程序 。 首 先 ， 
我 们 编写 一 个 独 立 的 函数 getline， 它 读 取 输入 的 下 一 行 。 我 们 尽量 保 
持 该 函数 在 其 它 场 台 也 有 用 。 公 少 getline 函数 应 该 在 读 到 文件 末尾 时 
返回 一 个 信号 ;更 为 有 用 的 设计 是 它 能 够 在 读 入 文本 行 时 返回 该 行 的 长 
度 ， 而 在 遇 到 文件 结束 符 时 返回 0。 由 于 0 不 是 有 效 的 行 长 度 ， 因 此 可 
以 作为 标志 文件 结束 的 返回 值 。 每 一 行军 少 包括 一 个 字符 ， 只 包含 换 
行 符 的 行 ， 其 长 度 为 1。 

当 发 现 菏 个 新 读 入 的 行 比 以 前 读 入 的 最 长 行 还 要 长 时 ， 惑 需要 把 该 行 保 
和 

位置。 


最 后 ， 我 们 需要 在 主 函 数 main 中 控制 getline 和 copy 这 两 个 函数 。 以 下 
便 是 我 们 编 写 的 程序 : 


#include <stdio.h> 














#define MAXLINE 1000 /* maximum input line length */ 


int getline(char line[], int maxline); void copy(char to[], char from[]); 


/* print the longest input line */ main() 


{ 

int len; /* current line length */ 

int max; /* maximum length seen so far */ char 
line[MAXLINE]; /* current input line */ 


char longest{MA XLINE]; /* longest line saved here */ 
max = 0; 
while ((len = getline(line, MAXLINE)) > 0) if (len > max) { 


max = len; copy(longest, line); 


} 

if (max > 0) /* there was a line */ printf("%s", longest); 

return 0; 

} 

/* getline: read a line into s, return length */ int getline(char 


s[],int lim) 

{ 

int c, i; 

for (i=0; i < limel && (c=getchar())!=EOF && c!='\n'; ++i) sli] = c; 
if (c == ^n’) { sli] = c; 


++i; 


} 
sli] = '\0'; return i; 
} 


/* copy: copy ‘from’ into 'to'; assume to is big enough */ void 
copy(char to[], char from[]) 


while ((toli] = from[i]) != ^0 
++i; 
} 


程序 的 开始 对 getline 和 copy 这 两 个 函数 进行 了 声明 ， 这 里 假定 它们 都 
存放 在 同一 个 文件 中 。 


main oe 之 间 通 过 一 对 参数 及 一 个 返回 值 进行 数据 交换 。 在 
getline 函数 中 ， 两 个 参数 是 通过 程序 行 


int getline(char s[], int lim) 


声明 的 ， 它 把 第 一 个 参数 s 声明 为 数组 ， 把 第 二 个 参数 lim 声明 为 整 
型 ， 声 明 中 提供 数组 大 小 的 目的 是 留 出 存储 空间 。 在 getline 函数 中 没 
有 必要 指明 数组 s 的 长 度 ， 这 是 因为 该 数组 








的 大 小 是 在 main 函数 中 设置 的 。 如 同 power 函数 一 样 ，getline 函数 使 
用 了 一 个 return 语句 将 值 返回 给 其 调用 者 。 上 述 程序 行 也 声明 了 getline 
数 的 返回 值 类 型 为 int。 由 于 函数 的 默认 返回 值 类 型 为 int， 因 此 这 里 的 
int 可 以 省 略 。 


有 些 函 数 返 回 有 用 的 值 ， 而 有 些 函 数 (如 copy) 仅 用 于 执行 一 些 动作 ， 
并 不 返回 值 。copy 


图 数 的 返回 值 类 型 为 void， 它 显 式 说 明 该 函数 不 返回 任何 值 。 

getline 了 男 数 把 字符 \0( 即 空 字符 ， 其 值 为 0) 插 入 到 它 创 建 的 数组 的 末 
尾 ， 以 标记 字符 串 的 结束 。 这 一 约定 已 被 C 语言 采用 : 当 在 C 语言 程序 
中 出 现 类 似 于 

"hello\0" 


的 字符 串 常量 时 ， 它 将 以 字符 数组 的 形式 存储 ， 数 组 的 各 元 素 分 别 存储 
字符 串 的 各 个 字符 ， 并 以 \O 标 志 字 符 串 的 结 








hlelllllolsalso 


printf 函数 中 的 格式 规范 gs 规定 ， 对 应 的 参数 必须 是 以 这 种 形式 表示 的 
FRE. copy 函数 的 实现 正 是 依赖 于 输入 参数 由 \0' 结 束 这 一 事实 ， 它 
将 \0 找 贝 到 答 出 参数 中 。( 也 就 是 说 ， 空 字符 \0 不 是 普通 文本 的 一 部 

分 。) 


值得 一 提 的 是 ， 即 使 是 上 述 这 样 很 小 的 程序 ， 在 传递 参数 时 也 会 遇 到 一 
些 麻 烦 的 设计 问题。 例如 ， 当 读 入 的 行 长 度 大 于 允许 的 最 大 值 时 ， 
main 函数 应 该 如 何 处 理 ，getline 函数 的 执行 是 安全 的 ， 无 论 是 否 到 达 
换行 符 字 符 ， 当 数组 满 时 它 将 停止 读 字符 。main 函数 可 以 通 过 测试 行 
的 长 度 以 及 检查 返回 的 最 后 一 个 字符 来 判定 当前 行 是 否 太 长 ， 然 后 再 根 
据 具 体 的 情况 处 理 。 为 了 简化 程序 ， 我 们 在 这 里 不 考 碟 这 个 问题 。 


调用 getline 函数 的 程序 无 法 预先 知道 输入 行 的 长 度 ， 因 此 getline 函数 
需要 检查 是 否 洲 出 。 男 一 方面 ， 调 用 copy 函数 的 程序 知道 (也 可 以 找 
出 ) 字 符 串 的 长 度 ， 因 此 该 函数 不 需要 进行 错误 检查 。 

















练习 1916 修改 打印 最 长 文本 行 的 程序 的 主 程序 main， 使 之 可 以 打印 任 
意 长 度 的 输入 行 的 长 度 ， 并 尽 可 能 多 地 打印 文本 。 


练习 1°17 编写 一 个 程序 ， 打 印 长 度 大 于 80 个 字符 的 所 有 输入 
行 。 

练习 1°18 编写 一 个 程序 ， 删 除 每 个 输入 行 末 尾 的 空格 及 制 表 符 ， 并 删 
除 完全 是 空格 的 行 。 

练习 1°19 编写 函数 reverse(s)， 将 字符 串 s 中 的 字符 顺序 颠倒 过 来 。 使 
用 该 函数 编写 一 个 程序 ， 每 次 题 倒 一 个 输入 行 中 的 字符 顺序 。 


1.10 外 部 变量 与 作用 域 


main 函数 中 的 变量 (如 line. longest 等 ) 是 main 函数 的 私自 变量 或 局 部 
变量 。 由 于 它们 是 在 main 函数 中 声明 的 ， 因 此 其 它 函 数 不 能 直接 访问 
它们 。 其 它 函 数 中 声明 的 变量 也 同样 如 此 。 例 如 ，getline 函数 中 声明 
的 变量 i 与 copy 函数 中 声明 的 变量 i 没有 关系 。 函 数 中 的 每 个 局 部 变 
量 只 在 函数 被 调用 时 存在 ， 在 函数 执行 完毕 退出 时 消失 。 这 也 是 其 它 语 
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通常 把 这 类 变量 称 为 自动 变 最 的 原因 。 以 后 我 们 使 用 "自动 变量 " 代 
表 " 局 部 变量 "。( 第 4 


static 存储 类 ， 这 种 类 型 的 局 部 变量 在 多 次 函数 调用 之 间 保 持 
NAR ) 


由 于 自动 变量 只 在 函数 调用 执行 期 间 存 在 ， 因 此 ， 在 函数 的 两 次 调用 之 
间 ， 上 自动 变量 不 保留 前 次 调用 时 的 赋值 ， 且 在 每 次 进入 函数 时 都 要 显 
式 为 其 赋值 。 如 打上 自动 变量 没有 赋值 ， 则 其 中 存放 的 是 无 效 值 。 


除 上 自动 变量 外 ， 还 可 以 定义 位 于 所 有 函数 外 部 的 变量 ， 也 就 是 说 ， 在 所 
有 函数 中 都 可 以 通过 变量 名 访问 这 种 类 型 的 变量 (这 机 制 同 Fortran 语言 
中 的 COMMON 变量 或 Pascal 语言 中 最 外 层 程 序 块 声明 的 变量 非常 类 
似 )。 由 于 外 部 变量 可 以 在 全 局 范围 内 访问 ， 因 此 ， 函 数 间 可 以 通过 外 
部 变量 交换 数据 ， 而 不 必 使 用 参数 表 。 再 者 ， 外 部 变量 在 程序 执行 期 间 
一 直 存 在 ， 而 不 是 在 函数 调用 时 产生 、 在 函数 执行 完毕 时 消失 。 即 使 
在 对 外 部 变量 赋值 的 函数 返回 后 ， 这 些 变量 仍 将 保持 原来 的 值 不 变 。 


外 部 变量 必须 定义 在 所 有 函数 之 外 ， 且 只 能 定义 一 次 ， 定 义 后 编译 程序 
将 为 它 分 配 存 储 单元 。 在 每 个 需要 访问 外 部 变量 的 函数 中 ， 必 须 声明 
相应 的 外 部 变量 ， 此 时 说 明 其 类 型 。 声 明 时 可 以 用 extern 语句 显 式 声 
明 ， 也 可 以 通过 上 下 文 隐 式 声明 。 为 了 更 详细 地 讨论 外 部 变 量 ， 我 们 
改写 上 述 打 印 最 长 文本 行 的 程序 ， 把 line. longest 与 max 声明 成 外 部 变 
量 。 这 需要 修改 这 3 个 函数 的 调用 、 声 明 与 函数 体 。 















































int getline(void); void copy(void); 

/* print longest input line; specialized version */ main() 
{ 

int len; 

extern int max; 

extern char longest|]; 


max = 0; 


while ((len = getline()) > 0) if (len > max) { 

max = len; copy(); 

} 

if (max > 0) /* there was a line */ printf("%s", longest); 
return 0; 

} 

/* getline: specialized version */ int getline(void) 
{ 

int c, 1; 

extern char line| ]; 

for (i = 0; i < MAXLINE ¢ 1 

&& (c=getchar)) != EOF && c != \n; ++i) line[i] = c; 

if (c == ^n’) { line[i] = c; 

++i; 


} 


line[i] = '\0'; return i; 

} 

/* copy: specialized version */ void copy(void) 

{ 

int 1; 

extern char line[], longest[]; 

i=0; 

while ((longest[i] = line[i]) != '\0') 

FFI 

} 

在 该 例子 中 ， 前 几 行 定 义 了 main, getline 与 copy 函数 使 用 的 几 个 外 部 
变量 ， 声 明 了 各 外 部 变量 的 类 型 ， 这 样 编译 程序 将 为 它们 分 配 存 储 单 
元 。 从 语法 角度 看 ， 外 部 变量 的 定 义 与 局 部 变量 的 定义 是 相同 的 ， 但 
由 于 它们 位 于 各 函数 的 外 部 ， 因 此 这 些 变量 是 外 部 变量 。 函数 在 使 用 
外 部 变量 之 前 ， 必 须要 知道 外 部 变量 的 名 字 。 要 达到 该 目的 ， 一 种 方式 
是 在 函数 中 使 用 extern 类 型 的 声明 。 这 种 类 型 的 声明 除了 在 前 面 加 了 
一 个 关键 字 extern 外 ， 其 它 方面 与 普通 变量 的 声明 相同 。 

某 些 情况 下 可 以 省 略 extern 声明 。 在 源 文件 中 ， 如 果 外 部 变量 的 定义 出 
现在 使 用 它 的 函数 之 前 ， 那 么 在 那个 函数 中 就 没有 必要 使 用 extern 声 
HH. AE, main, getline 及 copy 中 的 几 个 extern 声明 都 是 多 余 的 。 在 
通常 的 做 法 中 ， 所 有 外 部 变量 的 定义 都 放 在 源 文件 的 开始 处 ， 这 样 就 
可 以 省 略 extern 声明 。 

如 采 程 序 包含 在 多 个 源 文件 中 ， 而 某 个 变量 在 filel 文件 中 定义 、 在 
file2 和 file3 文件 中 使 用 ， 那 么 在 文件 file2 与 file3 中 就 需要 使 用 extern 
声明 来 建立 该 变量 与 其 定 义 之 间 的 联系 。 人 们 通常 把 变量 和 函数 的 
extern 声明 放 在 一 个 单独 的 文件 中 (习惯 上 称 之 为 头 文件 )， 并 在 每 个 源 
































文件 的 开头 使 用 矶 nclude 语句 把 所 要 用 的 头 文件 包含 进来 。 后 绥 名 .h 约 
定 为 头 文件 名 的 扩展 名 。 例 如 ， 标 准 库 中 的 函数 就 是 在 类 似 于 <stdio.h> 
的 头 文件 中 声明 的 。 更 详细 的 信息 将 在 第 4 章 中 讨论 ， 第 7 章 及 附录 也 
将 讨论 函数 库 。 


在 上 述 特别 版 本 中 ， 由 于 getline 与 copy MARTE, KEMAS E 

上 讲 ， 在 源 文 件 开始 处 它们 的 原型 应 该 是 getline() 与 copy). (AA SS 

老 版 本 的 C 语言 程序 兼容 ， ANSI C 语言 把 空 参数 表 看 成 老 版 本 C 语言 

的 声明 方式 ， 并 且 对 参数 表 不 再 进行 任何 检查 。 在 ANSI C 中， 如果 要 

人 
一 步 讨论 。 


读者 应 该 注意 到 ， 这 节 中 我 们 在 谈论 外 部 变量 时 齐 慎 地 使 用 了 定义 
(define) 与 声明 (declaration) 这 两 个 词 。 "定义 "表示 创建 变量 或 分 配 存储 
单元 ， 而 "声明 " 指 的 是 说 明 变 量 的 性 质 ， 但 并 不 分 配 存储 单元 。 


顺便 提 一 下 ， 现 在 越 来 越 多 的 人 把 用 到 的 所 有 东西 都 作为 外 部 变量 使 
用 ， 因 为 似乎 这 样 可 以 简化 数据 的 通信 一 一 参数 表 变 短 了 ， 且 在 需要 
时 总 可 以 访问 这 些 变量 。 但 是 ， 即 使 在 不 使 用 外 部 变量 的 时 候 ， 它 们 
也 是 存在 的 。 过 分 依赖 外 部 变量 会 导致 一 定 的 风险 ， 因 为 它 会 使 程序 
中 的 数据 关系 模糊 不 清 一 一 外 部 变量 的 值 可 能 会 被 意外 地 或 不 经 意 地 修 
改 ， 而 程序 的 修 改 又 变 得 十 分 困难 。 我 们 前 面 编写 的 打印 最 长 文本 行 
的 程序 的 第 2 个 版 本 就 不 如 第 1 个 版 本 

好 ， 原 因 有 两 方面 ， 其 一 便 是 使 用 了 外 部 变量 ; 妃 一 方面 ， 第 2 个 版 本 


中 的 函数 将 它们 所 操纵 的 变量 名 直接 写 入 了 函数 ， 从 而 使 这 两 个 有 用 
的 函数 失去 了 通用 性 。 





























到 目前 为 止 ， 我们 已 经 对 C 语言 的 传统 核心 部 分 进行 了 了 介绍。 借助 于 这 
些 少量 的 语言 元 素 ， 我 们 已 经 能 够 编写 出 相当 规模 的 有 用 的 程序 。 建 
议 读者 人 花 一 些 时 间 编 写 程序 作为 练习 。 下 面 的 儿 个 练习 比 本 半 前 面 编 
写 的 程序 要 复杂 一 些 。 


练习 1°20 编写 程序 detab， 将 输入 中 的 制 表 符 蔡 换 成 适当 数目 的 空格 ， 
使 空格 充满 到 下 一 个 制 表 符 终止 位 的 地 方 。 假 设 制 表 符 终止 位 的 位 置 
是 固定 的 ， 比 如 每 隔 n 列 就 会 出 现 一 个 制 表 符 终止 位 。n 应 该 作为 变量 
还 是 符号 常量 昵 ? 


练习 1621 编写 程序 entab， 将 空格 串 蔡 换 为 最 少数 量 的 制 表 符 和 空格 ， 
但 要 保持 单词 之 间 的 间隔 不 变 。 假 设 制 表 符 终止 位 的 位 置 与 练习 1*20 
的 detab 程序 的 情况 相同 。 当 使 用 一 个 制 表 符 或 者 一 个 空格 都 可 以 到 达 
下 一 个 制 表 符 终止 位 时 ， 选 用 哪 一 种 蔡 换 字符 比较 好 ? 


练习 1922 编写 一 个 程序 ， 把 较 长 的 输入 行 " 折 " 成 短 一 些 的 两 行 或 多 行 ， 
折 行 的 位 置 在 输入 行 的 第 n 列 之 前 的 最 后 一 个 非 空 格 之 后 。 要 保证 程 
0 E 
I 情况 。 


ZKJ 1°23 编写 一 个 删除 C 语言 程序 中 所 有 的 注释 语句 。 要 正确 处 理 带 
引号 的 字符 串 与 字符 常量 。 在 C 语言 中 ， 注 释 不 允许 髓 套 。 


练习 1924 编写 一 个 程序 ， 但 找 C 语言 程序 中 的 基本 语法 错误 ， 如 圆 括 
号 、 方 括号 、 花 括号 不 配对 等 。 要 正确 处 理 引 号 (包括 单 引号 和 双 引 
号 )、 转 义 字 符 序列 与 注释 。( 如 果 读 者 想 把 该 程序 编写 成 完全 通用 的 程 
序 ， 难 度 会 比较 大 。) 





























第 2 章 RA, WHA SRA 


变量 和 常量 是 程序 处 理 的 两 种 基本 数据 对 象 。 声 明 语句 说 明 变 量 的 名 字 
及 类 型 ， 也 可 以 指定 变量 的 初 值 。 运 算 符 指定 将 要 进行 的 操作 。 表 达 
式 则 把 变量 与 第 量 组 合 起 来 生成 新 的 值 。 对 象 的 类 型 决定 该 对 象 可 取 
值 的 集合 以 及 可 以 对 该 对 象 执行 的 操作 。 本 章 将 详细 讲述 这 些 内 容 。 


ANSI 标 准 对 语言 的 基本 类 型 与 表达 式 做 了 许多 小 的 修改 与 增补 。 
所 有 整 型 都 包括 signed( 带 符号 ) 和 unsigned( 无 符号 ) 两 种 形式 ， 且 可 以 
表示 无 符号 第 量 与 十 六 进 制 字 符 第 量 。 浮 点 运算 可 以 以 单 精度 进行 ， 

还 可 以 使 用 更 高 精度 的 long double 类 型 运算 。 字 符 串 常量 可 以 在 编译 
时 连接 。ANSI C 还 文 持 枚 举 类 型 ， 该 语言 特性 经 过 了 长 期 的 发 展 才 形 
成 。 对象 可 以 声明 为 const( 癌 量 ) 类 型 ， 表 明 其 值 不 能 修改 。 该 标准 
eer mtg eee eee 
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2.1 变量 名 


对 变量 的 命名 与 符号 常量 的 命名 存在 一 些 限 制 条 件 ， 这 一 点 我 们 在 第 1 
章 没 有 说 明 。 名 字 是 由 字母 和 数字 组 成 的 序列 ， 但 其 第 一 个 字符 必须 
为 字母 。 下 划 线 “_" 被 看 做 是 字母 ， 通 常用 于 命名 较 长 的 变量 名 ， 以 所 
高 其 可 读 性 。 由 于 例 程 的 名 字 通 币 以 下 划 线 开头 ， 因 此 变量 名 不 要 以 
下 划 线 开头 。 大 写字 母 与 小 写字 母 是 有 区 别 的 ， 所 以 ，Xx 与 是 两 个 不 
同 的 名 字 。 在 传统 的 C 语言 用 法 中 ， 变 量 名 使 用 小 写字 母 ， 符 号 种 量 
名 全 部 使 用 大 写字 母 。 


对 于 内 部 名 而 言 ， 至 少 前 31 个 字符 是 有 效 的 。 函 数 名 与 外 部 变量 名 包 
含 的 字符 数目 可 能 小 于 31， 这 是 因为 汇编 程序 和 加 载 程 序 可 能 会 使 用 
这 些 外 部 名 ， 而 语言 本 身 是 无 法 控制 加 载 和 汇编 程序 的 。 对 于 外 部 
名 ，ANSI 标准 仅 保证 前 6 个 字符 的 惟一 性 ， 并 且 不 区 分 大 小 写 。 类 似 
于 if. else, int, float 等 关键 字 古 保留 给 语言 本 里 使 用 的 ， 不 能 把 它们 
用 做 变量 名 。 所 有 关 健 字 中 的 字符 都 必须 小 写 。 


选择 的 变量 名 要 能 够 尽量 从 字面 上 表达 变量 的 用 途 ， 这 样 做 不 容易 引起 
混 消 。 局 部 变量 一 般 使 用 较 短 的 变量 名 (尤其 是 循环 控制 变量 )， 外 部 变 
量 使 用 较 长 的 名 字 。 




































































2.2 数据 类 型 及 长 大 

C 语言 只 提供 了 下 列 几 种 基本 数据 类 型 : 

char 字符 型 ， 占 用 一 个 字 节 ， 可 以 存放 本 地 字符 集中 的 一 个 字符 
int 整 型 ， 通 党 反映 了 所 用 机 器 中 整数 的 最 自然 长 度 

float 单 精度 浮 点 型 

double 双 精 度 浮 点 型 


此 外 ， 还 可 以 在 这 些 基本 数据 类 型 的 前 面 加 上 一 些 限定 符 。short 与 
long 两 个 限定 符 用 于 限定 整 型 : 














short int sh; 


long int counter; 


EN 关键 字 int 可 以 省 略 。 通 常 很 多 人 也 习惯 这 
么 做 。 


short 与 long 两 个 限定 符 的 引入 可 以 为 我 们 提供 满足 实际 需要 的 不 同 长 
度 的 整 型 数 。 int 通常 代表 特定 机 器 中 整数 的 上 自然 长 上 度 。short 类 型 通常 
为 16 fz, long 类 型 通常 为 32 fr, int 类 型 可 以 为 16 位 或 32 位 。 各 编 
译 器 可 以 根据 硬件 特性 自主 选择 合适 的 类 型 长 度 ， 但 要 遵循 下 列 限 

制 :short 与 int 类 型 至 少 为 16 位 ， 而 long 类 型 至 少 为 32 位 ， 并 且 short 
类 型 不 得 长 于 int 类 型 ， 而 int 类 型 不 得 长 于 long 类 型 。 


类 型 限定 符 signed 与 unsigned 可 用 于 限定 char 类 型 或 任何 整 型 。 
unsigned 类 型 的 数 总 是 正 值 或 0， 并 遵守 算术 模 2 "定律 ， 其 中 nn 是 该 类 
型 占用 的 位 数 。 例 如 ， 如 果 char 对 象 占用 8 人 位， 那么 unsigned char 类 
型 变量 的 取 值 范围 为 0t255， 而 signed char 类 型 变量 的 取 值 范围 则 为 
*128g127( 在 采用 对 二 的 补 码 的 机 器 上 )。 不 带 限 定 符 的 char 类 型 对 象 是 
侍 带 符号 则 取决 于 具体 机 器 ， 但 可 打印 字符 总 是 正 值 。 


long double 类 型 表示 高 精度 的 浮 点 数 。 同 整 型 一 样 ， 浮 点 型 的 长 上 度 也 取 
决 于 具体 的 实 现 。float、double 与 long double 类 型 可 以 表示 相同 的 长 
度 ， 也 可 以 表示 两 种 或 三 种 不 同 的 长 度 。 


有 关 这 些 类 型 长 度 定 义 的 符号 常量 以 及 其 它 与 机 器 和 编译 器 有 关 的 属性 
可 以 在 标准 头 文 件 <limits.h> 与 <float.h> 中 找到 ， 这 些 内 容 将 在 附录 B 


练习 291 编写 一 个 程序 以 确定 分 别 由 signed 及 unsigned 限定 的 char, 
short. int 与 long 类 型 变量 的 取 值 范围 。 采 用 打印 标准 头 文 件 中 的 相应 
值 以 及 直接 计算 两 种 方式 实 现 。 后 一 种 方法 的 实现 较 困 难 一 些 ， 因 为 
要 确定 各 种 浮 点 类 型 的 取 值 范 围 。 


2.3 常量 
类 似 于 1234 的 整数 常量 属于 int 类 型 。long 类 型 的 常量 以 字母 1 或 工 结 


尾 ， 如 123456789L 。 如 果 一 个 整数 太 大 以 至 于 无 法 用 int 类 型 表示 时 ， 
也 将 被 当 作 long 类 型 处 理 。 无 符号 常量 以 字母 u 或 U 结尾 。 后 级 忆 或 





























UL 表明 是 unsigned long 类 型 。 


浮 点 数 常量 中 包含 一 个 小 数 点 (如 123.4) 或 一 个 指数 (如 le*2)， 也 可 以 两 
者 都 有 。 没有 后 级 的 浮 点 数 常 量 为 double 类 型 。 后 级 f 或 F 表示 float 
KH, MWER 1 或 工 则 表 示 long double 类 型 。 


整 型 数 除了 用 十 进 制 表示 外 ， 还 可 以 用 八进制 或 十 六 进 制 表示 。 带 前 绥 
0 的 整 型 常量 表 示 它 为 八进制 形式 ;前 缀 为 0x 或 0X， 则 表示 它 为 十 六 
进 制 形式 。 例 如 ， 十 进 制 数 31 可 以 写 成 八进制 形式 037， 也 可 以 写成 
十 六 进 制 形式 0x1f 或 0XIF。 八 进 制 与 十 六 进 制 的 常量 也 可 以 使 用 后 绥 
L 表示 long 类 型 ， 使 用 后 级 U 表示 unsigned 类 型 。 例 如 ，0XFUL 是 一 
个 unsigned long 类 型 (无 符号 长 整 型 ) 的 常量 ， 其 值 等 于 十 进 制 数 15。 


一 个 字符 常量 是 一 个 整数 ， 书 写 时 将 一 个 字符 括 在 单 引号 中 ， 如 ，%x，。 
字符 在 机 器 字符 集中 的 数值 就 是 字符 常量 的 值 。 例 如 ， 在 ASCII 字符 
集中 ， 字 符 '0 的 值 为 48， 它 与 数值 0 没有 关系 。 如 果 用 字符 '0' 代 将 这 个 
与 具体 字符 集 有 关 的 值 (比如 48)， 那 么 ， 程 序 就 无 需 关 心 该 字符 对 应 的 
具体 值 ， 增 加 了 程序 的 易 读 性 。 字 符 常量 一 般 用 来 与 其 它 字符 进行 比 

较 ， 但 也 可 以 像 其 它 整数 一 样 参与 数值 运算 ， 





某 些 字符 可 以 通过 转 义 字符 序列 (例如 ， 换 和 THN ATS RE 
常量 。 转 义 字 符 序列 看 起 来 像 两 个 字符 ， 但 只 表示 一 个 字符 。 男 外 ， 
我 们 可 以 用 








\ooo' 


表示 任意 的 字 节 大 小 的 位 模式 。 其 中 ，ooo 代表 13 个 八进制 数字 (0.… 
7)。 这 种 位 模式 还 可 以 用 


‘\xhh' 


表示 ， 其 中 ， hh 是 一 个 或 多 个 十 六 进 制 数字 (0.， 9, a..f, A..F). Al 
此 ， 我 们 可 以 按照 下 列 形式 书写 语句 : 








#define VTAB ‘\013' /* ASCII vertical tab */ 
#define BELL '\007' /* ASCII bell character */ 
述 语 句 也 可 以 用 十 六 进 制 的 形式 书写 为 : 
#define VTAB ‘\xb' /* ASCII vertical tab */ 
#define BELL '\x7' /* ASCII bell character */ ANSI C 语言 中 的 全 


部 转 义 字符 序列 如 下 所 示 : 


啊 铃 符 ARHI 


"y 





人 | 十 一 | 
pe 


Fond | 


FAT HORAN LA ON, EMET). RINE AHAH 
EARE 0, 以 强调 某 些 表达 式 的 字符 属性 ， 但 其 数字 值 为 0。 


量 表达 式 是 仅仅 只 包含 常量 的 表达 式 。 这 种 表达 式 在 编译 时 求 值 ， 而 
不 在 和 云 行 时 求 值 。 它 可 以 出 现在 第 量 可 以 出 现 的 任何 位 置 ， 例 如 : 


#define MAXLINE 1000 char linePMAXLINE+1]; 
an 


#define LEAP 1 /* in leap years */ 











int days[31+28+LEAP+31+30+31+30+31+31+30+31+30+31]; 


“ERE AB is Ae EAB ETL, EANA STR RORY 0 个 或 多 个 字符 组 
成 的 字符 序列 。 例如 : 


"I am a string" 
ni 
pe EPIT */ 
都 是 字符 串 。 双 引号 不 是 字符 串 的 一 部 分 ， 它 只 用 于 限定 字符 串 。 字 符 


贡 量 中 使 用 的 转 义 字 符 序 列 同样 世 可 以 用 在 字符 串 中 。 在 字符 串 中 使 
用 \ 表示 双 引 号 字符 。 编 译 时 可 以 将 多 个 字 符 串 音量 连接 起 来 ， 例 如 ， 





下 列 形式 ; 


"hello," " world" 


等 从 于 
"hello, world" 


TITER AY BLE EB ARER K EIT E SP LEE PTR CAE AT PERS 5C 
Fo 从 技术 角度 看 ， 字 符 串 音量 就 是 字符 数组 。 字 符 串 的 内 部 表示 使 
FAN 28 FFF NOTEA 
串 的 结尾 ， 因 此 。 存 储 字符 串 的 物理 存储 单元 数 比 括 在 双 引 号 中 的 字符 
数 多 一 个 。 这 种 表示 


方法 也 说 明 ，C 语言 对 字符 串 的 长 度 没 有 限制 ， 但 程序 必须 扫描 完整 个 
字符 串 后 才能 确定 字符 串 的 长 度 。 标 准 库 函数 strlen(s) 可 以 返回 字符 串 
oe 但 长 度 不 包括 末尾 的 \0'。 下面 是 我 们 设计 的 strlen 函数 
\ | 一 | : 


/* strlen: return length of s */ int strlen(char s[]) 








{ 

int 1; 

while (s[i] != ^0) 
++i; 

return 1; 

} 


标准 头 文件 <string.h> 中 声明 了 strlen 和 其 它 字 符 串 函数 。 我 们 应 该 搞 清 
楚 字 符 常 量 与 仪 包含 一 个 字符 的 字符 串 之 间 的 区 别 :x' 与 "x" 是 不 同 的 。 


前 者 是 一 个 整数 ， 其 值 是 字母 x 在 机 器 字符 集中 对 应 的 数值 (内 部 表示 
值 ; 后 者 是 一 个 包含 


一 个 字符 ( 即 字 和 母 x) 以 及 一 个 结束 符 \0' 的 字符 数组 。 





0 aaa 

j: 

enum boolean { NO, YES }; 

在 没有 显 式 说 明 的 情况 下 ，enum 类 型 中 第 一 个 枚 举 名 的 值 为 0， 第 二 

个 为 1， 依 此 类 推 。 如 果 只 指定 了 部 分 枚 举 名 的 值 ， 那 么 未 指定 值 的 枚 
ee ene rene eee ee 

二 个 例 于 : 


enum escapes { BELL = \a', BACKSPACE = \b, TAB = \t, NEWLINE = 
\n', VTAB = \v, RETURN = 'r' }; 








enum months { JAN = 1, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, 
OCT, NOV, DEC }; 


/* FEB 的 值 为 2，MAR 的 值 为 3， 依 此 类 推 */ 

不 同 枚 举 中 的 名 字 必 须 互 不 相同 。 同 一 枚 举 中 不 同 的 名 字 可 以 具有 相同 
的 值 。 枚 举 为 建立 常量 值 与 名 字 之 间 的 关联 提供 了 一 种 便利 的 方式 。 
相对 于 #define 语句 来 说 ， 


它 的 优势 在 于 常量 值 可 以 自动 生成 。 尽 管 可 以 声明 enum 类 型 的 变量 ， 
但 编译 器 不 检查 这 种 类 


型 的 变量 中 存储 的 值 是 否 为 该 枚 举 的 有 效 值 。 不 过 ， 枚 举 变 量 提供 这 种 
检查 ， 因 此 枚 举 比 


人 











2.4 声明 


所 有 变量 都 必须 先 声 明 后 使 用 ， 尽 管 茶 些 变 量 可 以 通过 上 下 文 隐 陈 地 声 
明 。 一 个 声明 指 定 一 种 变量 类 型 ， 后 面 所 带 的 变量 表 可 以 包含 一 个 或 
多 个 该 类 型 的 变量 。 例 如 : 


int lower, upper, step; char c, 1ine[1000]; 


一 个 声明 语句 中 的 多 个 变量 可 以 拆 开 在 多 个 声明 语句 中 声明 。 上 面 的 两 
个 声明 语句 也 可 以 等 价 地 写成 下 列 形 式 : 


int lower; int upper; int step; char c; 
cbar line[1000]; 


按照 这 种 形式 书写 代码 需要 占用 较 多 的 空间 ， 但 便于 疝 各 声明 语句 中 添 
加 注释 ， 也 便于 以 后 修改 。 


还 可 以 在 声明 的 同时 对 变量 进行 初始 化 。 在 声明 中 ， 如 果 变 量 名 的 后 面 
紧 跟 一 个 等 号 以 及 一 个 表达 式 ， 该 表达 式 束 充当 对 变量 进行 初始 化 的 
初始 化 表达 式 。 例 如 : 





char esc = '\\'; int i = 0; 
int limit = MAXLINE + 1; float eps = 1.0e¢5; 


如 果 变 量 不 是 自动 变量 ， 则 只 能 进行 一 次 初始 化 操作 ， 从 概念 上 讲 ， 应 
该 是 在 程序 开始 执行 之 前 进行 ， 并 且 初 始 化 表达 式 必 须 为 常量 表达 
式 。 每 次 进入 函数 或 程序 块 时 ， 显 式 初始 化 的 自动 变量 都 将 被 初始 化 
一 次 ， 其 初始 化 表达 式 可 以 是 任何 表达 式 。 默 认 情 况 下 ， 外 部 变 量 与 
静态 变量 将 被 初始 化 为 0。 未 经 显 式 初 始 化 的 自动 变量 的 值 为 未 定义 
值 ( 即 无 效 值 )。 

任何 变量 的 声明 都 可 以 使 用 const 限定 符 限 定 。 该 限定 符 指 定 变量 的 值 
不 能 被 修改 。 对 数组 而 言 ，const 限定 符 指 定数 组 所 有 元 素 的 值 都 不 能 
被 修改 : 

const double e = 2.71828182845905; const char msg[] = "warning: "; 


E E rae erie arene 























int strlen(const char[]); 


如 果 试 图 修改 const 限定 符 限定 的 值 ， 其 结果 取决 于 具体 的 实现 。 

2.5 算术 运算 符 

二 元 算术 运算 符 包括 :+、。、*、/、9%6( 取 模 运 算 符 )。 整 数 除法 会 截断 结 
果 中 的 小 数 部 分 。 表 达 式 

x%Y 

的 结果 是 x 除 以 y RB, Sx HER y 整除 时 ， 其 值 为 0。 例 如 ， 如 末 
某 一 年 的 年 份 能 被 4 整除 但 不 能 被 100 整除 ， 那 么 这 一 年 就 是 半年 ， 此 
外 ， 能 被 400 整除 的 年 份 也 是 国 年 。 因 此 ， 可 以 用 下 列 语句 判断 半年 : 


if ((year % 4 == 0 && year % 100 != 0) || year % 400 == 0) printf("%d is a 
leap year\n", year); 


else 


printf("%d is not a leap year\n", year); 


取 模 运算 符 % 不 能 应 用 于 float 或 double 类 型 。 在 有 负 操 作 数 的 情况 

下 ， 整 数 除法 截取 的 方 同 以 及 取 模 运算 结果 的 符号 取决 于 具体 机 器 的 
实现 ， 这 和 处 理 上 洲 或 下 洲 的 情况 是 一 样 的 。 

二 元 运算 符 + 和 。 具 有 相同 的 优先 级 ， 它 们 的 优先 级 比 运算 符 *、/ 和 % 的 
优先 级 低 ， 而 运 算 符 *、/ 和 % 的 优先 级 又 比 一 元 运算 符 + 和 。 的 优先 级 

低 。 算 术 运 算 符 采用 从 左 到 右 的 结合 规 则 。 

本 章 末 尾 的 表 201 完整 总 结 了 所 有 运算 符 的 优先 级 和 结合 律 。 

2.6 KAY a ey 

关系 运算 符 包 括 下 列 几 个 运算 符 : 


> >= < < 二 


它们 具有 相同 的 优先 级 。 优 先 级 仅 次 于 它们 的 古 相等 性 运算 符 : 











三 三 | 三 


关系 运算 符 的 优先 级 比 算术 运算 符 低 。 因 此 ， 表 达 式 i < lim。1 等 价 于 i 
< (lim。1)。 逻辑 运算 符 && 与 | 有 一 些 较为 特殊 的 属性 ， 由 && 与 | 连接 
的 表达 式 按 从 左 到 右 的 顺序 进 


行 求 值 ， 并 且 ， 在 知道 结 末 值 为 真 或 假 后 立即 俘 止 计算 。 绝 大 多 数 C 语 
言 程序 运用 了 这 些 属 


性 。 例 如 ， 下 列 在 功能 上 与 第 1 章 的 输入 函数 getline 中 的 循环 语句 等 
价 的 循环 语句 : 


for (i=0; i<lim°1 && (c=getchar()) != \n && c != EOF; ++i) sli] = c; 

在 读 入 一 个 新 字符 之 前 必须 先 检查 数组 s 中 足 否 还 有 空间 存放 这 个 字 
符 ， 因 此 必须 首先 测试 条 件 i<lim*1。 如 果 这 一 测试 失败 ， 就 没有 必要 
继续 读 入 下 一 字符 。 


类 似 地 ， 如 果 在 调用 getchar 函数 之 前 就 测试 是否 为 EOF， 结 宁 也 是 











不 正确 的 ， 因 此 ， 函数 的 调用 与 赋值 都 必须 在 对 c 中 的 字符 进行 测试 之 
前 进行 。 


运算 符 && 的 优先 级 比 | 的 优先 级 高 ， 但 两 者 都 比 关系 运算 符 和 相等 性 运 
算 符 的 优先 级 低 。 KE, KIEN 


i<lime1 && (c = getchar()) != \n' && c!= EOF 


束 不 需要 为 外 加 圆 括 写 。 但 是 ， 由 于 运算 符 != 的 优先 级 高 于 赋值 运算 符 
的 优先 级 ， 因 此 ， 在 表达 式 


(c = getchar()) != “AD' 


中 ， 就 需要 使 用 圆 括号 ， 这 样 才能 达到 预期 的 目的 : 移 把 函数 返回 值 赋 
值 给 c， 然 后 再 将 c 


与 进行 比较 。 


根据 定义 ， 在 关系 表达 式 或 逻辑 表达 式 中 ， 如 果 关 系 为 真 ， 则 表达 式 的 
结果 值 为 数值 1; 如 果 为 假 ， 则 结 末 值 为 数值 0。 


逻辑 非 运算 符 ! 的 作用 是 将 非 0 操作 数 转 换 为 0， 将 操作 数 0 转换 为 1。 
该 运算 符 通 季 用 于 下 列 类 似 的 结构 中 : 








if (valid) 
一 般 不 采用 下 列 形式 : 
让 (valid == 0) 


当然 ， 很 难 评判 上 述 两 种 形式 哪 种 更 好 。 类 似 于 !valid 的 用 法 读 起 来 更 
直观 一 些 ("如 果 不 是 有 效 的 )， 但 对 于 一 些 更 复杂 的 结构 可 能 会 难 了 了 理 
R, 


练习 202 在 不 使 用 运算 符 && 或 | 的 条 件 下 编写 一 个 与 上 面 的 for 循环 语 
句 等 价 的 循 环 语句 。 


2.7 类 型 转换 


当 一 个 运算 符 的 几 个 操作 数 类 型 不 同时 ， 就 需要 通过 一 些 规则 把 它们 转 
换 为 某 种 共同 的 类 型 。 一 般 来 说 ， 目 动 转换 是 指 把 "比较 罕 的 "操作 数 转 
换 为 "比较 宽 的 "操作 数 ， 并 且 不 丢失 信息 的 转换 ， 例 如 ， 在 计算 表达 式 
fti 时， 将 整 型 变量 i 的 值 自 动 转换 为 浮 点 型 (这 里 的 变量 f 为 浮 点 型 )。 
不 允许 使 用 无 意义 的 表达 式 ， 例 如 ， 不 允许 把 float 类 型 的 表达 式 作 为 
下 标 。 针 对 可 能 导致 信息 丢失 的 表达 式 ， 编 译 圳 可 能 会 给 出 警告 信息 ， 
比如 把 较 长 的 整 型 值 赋 给 较 短 的 整 型 变量 ， 把 浮 点 型 值 赋值 给 整 型 变 
量 ， 等 等 ， 但 这 些 表 达 式 并 不 非法 。 

由 于 char 类 型 就 是 较 小 的 整 型 ， 因 此 在 算术 表达 式 中 可 以 自由 使 用 char 
类 型 的 变量 ， 这 就 为 实现 茶 些 字符 转换 提供 了 很 大 的 灵活 性 ， 比 如 ， 
下 面 的 函数 atoi 就 是 一 例 ， 它 将 一 串 数字 转换 为 相应 的 数值 : 


/* atoi: convert s to integer */ int atoi(char s[]) 






































{ 
int i, n; 
n = 0; 


for (i = 0; s[i] >= '0' && sli] <= '9'; ++i) n = 10 * n + (s[i] ° '0'); 


retum n; 
} 

我 们 在 第 1 章 讲 过 ， 表 达 式 
S[ij。'0' 


能 够 计算 出 s[ 中 存储 的 字符 所 对 应 的 数字 值 ， 这 是 因为 0、1 等 在 字符 
集中 对 应 的 数 值 是 一 个 连续 的 递增 序列 。 


函数 lower 是 将 char 类 型 转换 为 int 类 型 的 另 一 个 例子 ， 它 将 ASCII 字 
符 集 中 的 字符 映射 到 对 应 的 小 写字 母 。 如 果 待 转换 的 字符 不 是 大 写字 
BE, lower 函数 将 返回 字符 本 里 。 





/* lower: convert c to lower case; ASCII only */ int lower(int c) 
{ 

if (c >='A' && c <= 'Z') 

return c + ‘a's 'A'; else 

return C; 


} 


上 述 这 个 函数 是 为 ASCI 字符 集 设 计 的 。 在 ASCI 字符 集中 ， 大 写字 
母 与 对 应 的 小 写字 母 作 为 数字 值 来 说 具有 固定 的 间隔 ， 并 且 每 个 字母 
表 都 是 连续 的 一 ”也 就 是 说 ， 在 AZ 之 间 只 有 字母 。 但 是 ， 后 面 一 点 
对 EBCDIC 字符 集 是 不 成 立 的 ， 因 此 这 一 函数 作用 在 EBCDIC 字符 集 
中 就 不 仅 限于 转换 字母 的 大 小 写 。 


附录 B 介绍 的 标准 头 文 件 <ctype.h> 定 义 了 一 组 与 字符 集 无 关 的 测试 和 
转换 函数 。 例 如 ，tolower(O 国 数 将 c 转换 为 小 写 形式 (如 果 c 为 大写 形 
式 的 话 )， 可 以 使 用 tolower 4% 上述 lower 函数 。 类 似 地 ， 测 试 语句 


c>='0' && c <= '9' 
可 以 用 该 标准 库 中 的 函数 
isdigit(c) 


蔡 代 。 在 本 书 的 后 续 内 容 中 ， 我 们 将 使 用 <ctype.h> 中 定义 的 函数 。 将 
字符 类 型 转换 为 整 型 时 ， 我 们 需要 注意 一 点 。C 语言 没有 指定 char 类 型 
的 变量 是 无 符 


号 变量 (signed) 还 是 带 符号 变量 (unsigned)。 当 把 一 个 char 类 型 的 值 转换 
为 int 类 


型 的 值 时 ， 其 结果 有 没有 可 能 为 负 整数 ?对 于 不 同 的 机 器 ， 其 结果 也 不 
同 ， 这 反映 了 不 同 机 


名 结构 之 间 的 区 别 。 在 茶 些 机 器 中 ， 如 下 char 类 型 值 的 最 左 一 位 为 1， 

则 转换 为 负 整 数 ( 进 行 "符号 扩展 ")。 而 在 另 一 些 机 器 中 ， 把 char 类 型 值 

在 char 类 型 值 的 左边 添加 0， 这样 导 致 的 转换 结 
总 是 正 值 。 


C 语言 的 定义 保证 了 机 器 的 标准 打印 字符 集中 的 字符 不 会 是 负 值 ， 
此 ， 在 表达 式 中 这 些 字符 总 是 正 值 。 但 是 ， 存 储 在 字符 变量 中 的 位 模 
式 在 某 些 机 器 中 可 能 是 负 的 ， 而 在 另 一 些 机 器 上 可 能 是 正 的 。 为 了 保 
证 程序 的 可 移植 性 ， 如 果 要 在 char 类 型 的 变量 中 存储 非 字 符 数 据 ， 最 
好 指定 signed 或 unsigned 限定 符 。 


当 关 系 表达 式 (如 ”i>j) 以 及 由 &&、| 连 接 的 逻辑 表达 式 的 判定 结果 为 真 












































时 ， 表 达 式 的 值 为 1; 当 判定 结果 为 假 时 ， 表 达 式 的 值 为 0。 因 此 ， 对 于 
赋值 语句 


d=c>='0' && c <= '9' 


来 说 ， 当 c 为 数字 时 ，d 的 值 为 1， 否 则 d 的 值 为 0。 但 是 ， 某 些 函 数 
(比如 isdigib 在 结 果 为 真 时 可 能 返回 任意 的 非 0 值 。 在 让、while、for 等 
语句 的 测试 部 分 中 ，" 真 " 束 意 味 着 " 非 0”*"， 这 二 者 之 间 没 有 区 别 。 


C 语言 中 ， 很 多 情况 下 会 进行 隐 式 的 算术 类 型 转换 。 一 般 来 说 ， 如 果 二 
元 运算 符 ( 具 有 两 个 操作 数 的 运算 符 称 为 二 元 运算 得 ， 比 如 + 或 *) 的 两 个 
操作 数 具有 不 同 的 类 型 ， 那 么 在 进行 运算 之 前 先 要 把 " 较 低 "的 类 型 提升 
为 " 较 融 "的 类 型 ， 运 算 的 结果 为 较 融 的 类 型 。 附 录 A.6 节 详 细 地 列 出 了 
这 些 转 换 规则 。 但 是 ， 如 果 没 有 unsigned 类 型 的 操作 数 ， 则 只 要 使 用 下 
面 这 些 非 正式 的 规则 束 可 以 了 : 


如 果 其 中 一 个 操作 数 的 类 型 为 long double， 则 将 另 一 个 操作 数 
转换 为 long double 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 double， 则 将 另 一 个 操作 数 转换 
为 double 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 float， 则 将 男 一 个 操作 数 转换 为 


float 类 型 ; 
将 char 与 short 类 型 的 操作 数 转 换 为 int 类 型 ; 


如 果 其 中 一 个 操作 数 的 类 型 为 long， 则 将 另 一 个 操作 数 也 转 
换 为 long 类 型 。 























注意 ， 表 达 式 中 float 类 型 的 操作 数 不 会 目 动 转换 为 double 类 型 ， 这 一 
扩 与 最 初 的 定 义 有 所 不 同 。 一 般 来 说 ， 数 学 函数 (如 标准 头 文 件 
<math.h> 中 定义 的 函数 ) 使 用 双 精 度 类 型 的 变量 。 使 用 float 类 型 主要 是 
为 了 在 使 用 较 大 的 数组 时 节省 存储 空间 ， 有 时 也 为 了 市 省 机 器 执行 时 
间 ( 双 精度 算术 运算 特别 费时 )。 


当 表 达 式 中 包含 unsigned 类 型 的 操作 数 时 ， 转 换 规 则 要 复杂 一 些 。 主 要 
原因 在 于 ， 带 符号 值 与 无 符号 值 之 间 的 比较 运算 是 与 机 器 相关 的 ， 
为 它们 取决 于 机 器 中 不 同 整数 类 型 的 大 小 。 例 如， 假定 int 类 型 占 16 
位 ，long 类 型 占 32 位 ， 那 么 ，*1L < 1U， 这 是 因为 unsighed int 类 型 的 
1U 将 被 提升 为 signed long 类 型 ;但 .1L > 1UL， 这 是 因为 1L 将 被 提升 为 
unslgned long 类 型 ， 因 而 成 为 一 个 比较 大 的 正 数 。 


赋值 时 也 要 进行 类 型 转换 。 赋 值 运算 符 右边 的 值 需 要 转换 为 左边 变量 的 
类 型 ， 左 边 变 量 的 类 型 即 赋值 表达 式 结果 的 类 型 。 

前 面 提 到 过 ， 无 论 是 否 进行 符号 扩展 ， 字 符 型 变量 都 将 被 转换 为 整 型 变 
量 。 当 把 较 长 的 整数 转换 为 较 短 的 整数 或 char 类 型 时 ， 超 出 的 高 位 部 
THREF. Ak, F 


列 程序 段 : 




















int i; char c; 
i=cc=]5 


执行 后 ，c 的 值 将 保持 不 变 。 无 论 是 否 进行 符号 扩展 ， 该 结论 都 成 立 。 
Be. 如 果 把 两 个 赋值 Ta A Re WUT ea RS ERS 








如 果 X 是 float 类 型 ，i 是 int 类 型 ， 那 么 语句 x=i 与 1=x 在 执行 时 都 要 
进行 类 型 转换 。 当 把 float 类 型 转换 为 int 类 型 时 ， 小 数 部 分 将 被 截取 
掉 ; 当 把 double 类 型 转换 为 float 类 型 时 ， 是 进行 四 舍 五 入 还 是 截取 取决 
于 具体 的 实现 。 


由 于 函数 调用 的 参数 是 表达 式 ， 所 以 在 把 参数 传递 给 函数 时 也 可 能 进行 
类 型 转换 。 在 没有 函数 原型 的 情况 下 ，char 与 short 类 型 都 将 被 转换 为 


int 类 型 ，float 类 型 将 被 转换 为 double 类 型 。 因 此 ， 即 使 调用 郴 数 的 参 
BON char 或 float 类 型 ， 我 们 也 把 函数 参数 声明 为 int 或 double 类 型 。 


最 后 ， 在 任何 表达 式 中 都 可 以 使 用 一 个 称 为 强制 类 型 转换 的 一 元 运算 和 从 
强制 进行 显 式 类 型 转换 。 在 下 列 语句 中 ， 表 达 式 将 按照 上 述 转换 规则 
被 转换 为 类 型 名 指定 的 类 型 : 


(类 型 名 ) 表达 式 我 们 可 以 这 样 来 理解 强制 类 型 转换 的 准确 含义 :在 上 述 
语句 中 ， 表 达 式 首先 锌 赋值 给 类 型 名 


指定 的 类 型 的 茶 个 变量 ， 然 后 再 用 该 变量 丛 换 上 述 整 条 语句 。 例 如 ， 库 
函数 sqrt 的 参数 为 


double 类 型 ， 如 果 处 理 不 当 ， 结 果 可 能 会 无 意义 (sqrt 在 <math.h> 中 声 
明 )。 因 此 ， 如 果 


n 是 整数 ， 可 以 使 用 

sqrt((double) n) 

在 把 n 传递 给 函数 sqrt 之 前 先 将 其 转换 为 double 类 型 。 注 意 ， 强 制 类 
型 转换 只 是 生成 一 个 指定 类 型 的 n 的 值 ，n 本 里 的 值 并 没有 改变 。 强 制 


类 型 转换 运算 符 与 其 它 一 元 运算 符 具 有 相 同 的 优先 级 ， 表 201 对 运算 符 
优先 级 进行 了 总 结 。 




















在 通常 情况 下 ， 参 数 是 通过 函数 原型 声明 的 。 这 样 ， 当 函数 被 调用 时 ， 
声明 将 对 参数 进 行 目 动 强制 转换 。 例 如 ， 对 于 sqrt 的 函数 原型 


double sqrt(double); 

下 列 函 数 调用 : 

root2 = sqrt(2); 

不 需要 使 用 强制 类 型 转换 运算 符 束 可 以 自动 将 整数 2 强制 转换 为 double 
类 型 的 值 2.0。 标准 库 中 包含 一 个 可 移植 的 实现 伪 随 机 数 发 生 器 的 函数 
rand 以 及 一 个 初始 化 种 子 数 的 

函数 srand。 前 一 个 函数 rand 使 用 了 强制 类 型 转换 。 

unsigned long int next = 1; 

/* rand: return pseudorrandom integer on 0..32767 */ int rand(void) 
{ 

next = next * 1103515245 + 12345; 

return (unsigned int)(next/65536) % 32768; 

} 

/* srand: set seed for rand() */ void srand(unsigned int seed) 

{ 

next = seed; 

} 


练习 203 编写 函数 htoif(s)， 把 由 十 六 进 制 数字 组 成 的 字符 串 ( 包 含 
可 选 的 前 级 Ox 


或 0X) 转 换 为 与 之 等 价 的 整 型 值 。 字 符 串 中 人 允许 包含 的 数字 包括 :099、 
amf 以 及 Auk. 


2.8 目 增 运算 符 与 目 威 运算 符 

C 语言 提供 了 两 个 用 于 变量 递增 与 递减 的 特殊 运算 符 。 自 增 运算 符 ++ 使 
其 操作 数 递 增 1， 目 减 运算 符 使 其 操作 数 递 减 1。 我 们 经 常 使 用 ++ 运 算 
和 从 递增 变量 的 值 ， 如 下 所 示 : 

if (c = ^n) 

++nl; 

++ 与 这 两 个 运算 符 特 殊 的 地 方 主 要 表现 在 :它们 既 可 以 用 作 前 缀 运算 符 
(用 在 变量 前 面 ， 如 ++n)。 也 可 以 用 作 后 级 运算 符 (用 在 变量 后 面 ， 如 
n++)。 在 这 两 种 情况 下 ， 其 效果 都 是 将 变量 n 的 值 加 1。 但 是 ， 它 们 之 
间 有 一 点 不 同 。 表 达 式 ++n 先 将 n 的 值 递 增 1， 然 后 再 使 用 变量 n 的 
值 ， 而 表达 式 n++ 则 是 先 使 用 变量 n 的 值 ， 然 后 再 将 n 的 值 递 增 1。 也 
就 是 说 ， 对 于 使 用 变量 n 的 值 的 上 下 文 来 说 ，++n 和 n++ 的 效果 是 不 同 
Ho WR n 的 值 为 5， 那 么 


X= 卫 十 十 ; 


执行 后 的 结果 是 将 x 的 值 置 为 5， 而 





X= ++n; 


将 x 的 值 置 为 6。 这 两 条 语句 执行 完成 后 ， 变 量 n 的 值 都 是 6。 目 增 与 
目 减 运算 符 只 能 作用 于 变量 ， 类 似 于 表达 式 (i+j)++ 是 非法 的 。 


在 不 需要 使 用 任何 具体 值 且 仅 需要 递增 变量 的 情况 下 ， 前 级 方式 和 后 级 
方式 的 效果 相同 。 例如 : 


if (c == '\n’) nl++; 


但 在 某 些 情况 下 需要 酌情 考虑 。 例 如 ， 考 虑 下 面 的 函数 squeeze(s, c), 
它 删 除 字符 串 s 


中 出 现 的 所 有 字符 c: 

/* squeeze: delete all c from s */ void squeeze(char s[], int c) 
{ 

int i, j; 


for (i = j = 0; s[i] != ^0'; i++) if (s[i] != ©) 

s[j++] = s[i]; 

s[j] = '\0'; 

} 

每 当 出 现 一 个 不 是 c 的 字符 时 ， 该 函数 把 它 拷贝 到 数组 中 下 标 为 j 的 位 
置 ， 随 后 才 将 j 的 值 增加 1， 以 准备 处 理 下 一 个 字符 。 其 中 的 证 语句 完 
全 等 价 于 下 列 语句 : 

if (s[i] != co) { 

s[j] = sli]; j++; 

} 


我 们 在 第 1 章 中 编写 的 函数 getline 是 类 似 结构 的 另外 一 个 例子 。 我 们 
可 以 将 该 函数 中 的 证 语句 : 


if (c =='\n’) { sli] = c; 





++i; 


} 

用 下 面 这 种 更 简洁 的 形式 代 蔡 : 
if (c == ^n’) 

sli++] = c; 


我 们 再 来 看 第 三 个 例子 。 考 虑 标准 函数 strcat(s, t), CEFE t 连接 到 
FAT s 的 尾部 。 函 数 streat BEST A s 中 有 足够 的 空间 保存 这 两 个 
字符 串 连接 的 结果 。 下 面 编写 的 这 个 函数 没有 任何 返回 值 (标准 库 中 的 
该 阔 数 返回 一 个 指 癌 新 字符 串 的 指针 ): 





/* strcat: concatenate t to end of s; s must be big enough */ void 
strcat(char s[], char t[]) 


while (s[i] != '\0') /* find end of s */ i++; 


while ((s[i++] = thj++]) !='\0') /* copy t */ 


} 


在 将 t 中 的 字符 逐个 找 贝 到 s 的 尾部 时 ， 变 量 1 和 j 使 用 的 都 是 后 缀 运 
算 符 ++， 从 而 保证 在 








循环 过 程 中 i 与 j 均 指向 下 一 个 位 置 。 


练习 204 squeeze(s1, s2)， 将 字符 串 s1 中 任何 与 字符 串 s2 中 字符 
匹配 的 字符 都 删除 。 


练习 2.5 编写 函数 any(s1, s2)， 将 字符 串 s2 中 的 任 一 字符 在 字符 串 s1 
中 第 一 次 出 现 的 位 置 作为 结果 返回 。 如 果 sl 中 不 包含 s2 中 的 字符 ， 则 
返回 1。( 标 准 库 函 数 strpbrk 具有 同样 的 功能 ， 但 它 返 回 的 是 指向 该 位 
置 的 指针 。) 

2.9. 按 位 运算 符 


C 语言 提供 了 6 个 位 操作 运算 符 。 这 些 运 算 符 只 能 作用 于 整 型 操作 数 ， 
即 只 能 作用 于 带 符 号 或 无 符号 chars shorts ints long 类 型 : 


& 按 位 与 (AND) 











| 按 位 或 (OR) 

^ 按 位 异 或 (XOR) 
<< 左 移 

>> 右 移 


~ 按 位 求 反 (一 元 运算 符 ) 
按 位 与 运算 符 & 经 常用 于 屏蔽 某 些 二 进 制 位 ， 例 如 : 
n=n&0177: 


该 语句 将 n PR 7 个 低 二 进 制 位 外 的 其 它 各 位 均 置 为 0。 按 位 或 运算 符 
第 用 于 将 某 些 二 进 制 位 置 为 1， 例如 :X=X|SET_ON; 


该 语句 将 x 中 对 应 于 SET_ON 中 为 1 的 那些 二 进 制 位 置 为 1。 


按 位 寞 或 运算 符 ^ 当 两 个 操作 数 的 对 应 位 不 相同 时 将 该 位 设置 为 1， 合 
则 ， 将 该 位 设置 为 


0。 


我 们 必须 将 位 运算 符 &、| 同 逻辑 运算 人 符 &&、| 区 分 开 来 ， 后 者 用 于 从 左 
至 右 求 表达 式 的 真 值 。 例 如 ， 如 果 x 的 值 为 1，Y 的 值 为 2， 那 么 ，x 
&y 的 结果 为 0， 而 x &&y WHA 1. 


移 位 运算 符 << 与 >> 分 别 用 于 将 运算 的 左 操作 数 左 移 与 右 移 ， 移 动 的 位 
数 则 由 右 操作 数 指 定 ( 右 操作 数 的 值 必须 是 非 负 值 )。 因 此 ， 表 达 式 x << 
2 将 把 x 的 值 左 移 2 位， 右边 空 出 的 2 位 用 0 填补 ， 该 表达 式 等 价 于 对 
左 操 作 数 乘 以 4。 在 对 unsigned 类 型 的 无 符号 值 进行 右 移 位 时 ， 左 边 空 
出 的 部 分 将 用 0 填补 ; 当 对 signed 类 型 的 带 符号 值 进行 右 移 时 ， 某 些 机 
器 将 对 左边 空 出 的 部 分 用 符号 位 填补 ( 即 " 算 术 移 位 ")， 而 男 一 些 机 器 则 
对 左边 空 出 的 部 分 用 0 填补 ( 即 "逻辑 移 位 ")。 


一 元 运算 符 ~ 用 于 求 整数 的 二 进 制 反 码 ， 即 分 别 将 操作 数 各 二 进 制 位 上 
的 1 变 为 0，0 变 为 1。 例 如 : 


X=X&~077 


将 把 x 的 最 后 6 位 设置 为 0。 注 意 ， 表 达 式 x & ~077 与 机 器 字 长 无 关 ， 
它 比 形式 为 x & 0177700 


的 表达 式 要 好 ， 同 为 后 者 假定 x 是 16 位 的 数值 。 这 种 可 移植 的 形式 并 
没有 增加 额外 开销 ， 














为 ，~077 是 常量 表达 式 ， 可 以 在 编译 时 求 值 。 


为 了 进一步 说 明 某 些 位 运算 符 ， 我 们 来 看 函数 getbits(x, p, n)， 它 返回 x 
中 从 右边 数 第 p 位 开始 回 右 数 n 位 的 字段 。 这 里 假定 最 右边 的 一 位 是 
第 0 = 都 是 合理 的 正 值 。 例 如，getbits(x, 4, 3) 返 回 x 中 第 4、 
3、2 三 位 的 值 。 





/* getbits: get n bits from position p */ unsigned getbits(unsigned x, 
int p, int n) 


{ 
return (x >> (p+1°n)) & ~(~0 << n); 
} 


其 中 ， 表 达 式 m << (p+1°n) 将 期 望 获得 的 字段 移 位 到 字 的 最 右 端 。~0 的 
所 有 位 都 为 1， 这 里 使 用 语句 ~0 << n 将 ~0 左 移 n 位 ， 并 将 最 右边 的 n 
位 用 0 填补 。 再 使 用 ~ 运算 对 它 按 位 取 反 ， 这 样 就 建立 了 最 右边 n 位 全 
为 1 的 屏蔽 码 。 


练习 2。6 编写 一 个 函数 setbits(x, p, n, y)， 该 函数 返回 对 x 执行 下 列 操作 
后 的 结果 值 :将 x 中 从 第 p 位 开始 的 n 个 (二 进 制 ) 位 设置 为 y 中 最 右边 n 
位 的 值 ，x 的 其 余 各 位 保持 不 变 。 

练习 2°7 编写 一 个 函数 invert(x, p, m， 该 图 数 返 回 对 X 执 行 下 列 操作 后 

的 结 果 值 :将 和 中 从 第 p 位 开始 的 na 个 (二 进 制 ) 位 求 反 ( 即 ，1 变 成 0，0 

变 成 1)，x 的 其 余 各 位 保持 不 变 。 


练习 298 编写 一 个 函数 rightrot(x, n)， 该 函数 返回 将 x 循环 右 移 ( 即 从 最 
右 端 移出 的 位 将 从 最 左 端 移 入 )n( 二 进 制 ) 位 后 所 得 到 的 值 。 

2.10 赋值 运算 符 与 表达 式 在 赋值 表达 式 中 ， 如 果 
表达 式 左边 的 变量 重复 出 现在 表达 式 的 右边 ， 如 :i 


= i+2 
































则 可 以 将 这 种 表达 式 缩写 为 下 列 形 式 : 
i+=2 


其 中 的 运算 符 += 称 为 赋值 运算 符 。 大 多 数 二 元 运算 符 ( 即 有 左 、 右 两 个 
操作 数 的 运算 待 ， 比 如 +) 都 有 一 个 相应 的 赋值 运算 


符 OD 一 ， 其 中 » OP 可 以 是 下 面 这 些 运算 符 之 一 : 


¥ % << >> & ^ 
| | 如果 和 expr2 ERAR, 那么 exprl op= expr2 


Ss 
expr1 = (expr1) op (expr2) 


它们 的 区 别 在 于 ， 前 一 种 形式 expri 只 计算 一 次 。 注 意 ， 在 第 二 种 形式 
中 ，expr2 两 边 的 圆 括号 是 必 不 可 少 的 ， 例 如 ， 





x*=y+1 
的 含义 是 : 
x=x*(y+1) 
而 不 是 
x=x*y+1 


我 们 这 里 举例 说 明 。 下 面 的 函数 bitcount 统计 其 整 型 参数 的 值 为 1 的 二 
进 制 位 的 个 数 。 


/* bitcount: count 1 bits in x */ int bitcount(unsigned x) 
{ 

int b; 

for (b = 0; x != 0; x >>= 1) if (x & 01) 

b++; 

return b; 

} 


这 里 将 X 声 明 为 无 符号 类 型 是 为 了 保证 将 X 右 移 时 ， 无 论 该 程序 在 什么 
机 器 上 运行 ， 左 边 空 出 的 位 都 用 “0( 而 不 是 符号 位 ) 填 补 。 


除了 简洁 外 ， 赋 值 运算 符 还 有 一 个 优点 :表示 方式 与 人 们 的 思维 习惯 比 
较 接近 。 我 们 通 常会 说 "把 2 加 到 i 上 "或 "把 ;增加 2"， 而 不 会 说 " 取 i 
的 值 ， 加 上 2， 再 把 结果 放 回 到 i 中"， 因 此 ， 表 达 式 1i+=2 比 i=i+2 
更 自然 ， 另 外 ， 对 于 复杂 的 表达 式 ， 例 如 : 








yyvallyypv[p3+p4] + yypv[p1+p2]] += 2 
赋值 运算 符 使 程序 代码 更 易于 理解 ， 代 人 码 的 阅读 者 不 必 笋 费 盏 心地 去 检 





查 两 个 长 表达 式 是 否 完全 一 样 ， 也 无 须 为 两 者 为 什么 不 一 样 而 疑惑 不 
解 ， 并 且 ， 赋 值 运算 符 还 有 助 于 编译 器 产生 高 效 代码 。 


从 上 述 例子 中 我 们 可 以 看 出 ， 赋 值 语 句 具 有 值 ， 且 可 以 用 在 表达 式 中 。 
下 面 是 最 常见 的 一 个 例子 : 


while ((c = getchar()) !=EOF) 

其 它 赋 值 运算 符 ( 如 +=、*= 等 ) 也 可 以 用 在 表达 式 中 ， 尽 管 这 种 用 法 比较 
少见 。 在 所 有 的 这 类 表达 式 中 ， 赋 值 表 达 式 的 类 型 是 它 的 左 操作 数 的 
类 型 ， 其 值 是 赋值 操作 完 

成 后 的 值 ， 

练习 2°9 在 求 对 二 的 补 码 时 ， 表 达 式 x &= (x 一 1) 可 以 删除 x 中 
最 右边 值 为 1 的 一 个 二 进 制 位 。 请 解释 这 样 做 的 道理 。 用 这 一 方法 重 
© bitcount 函数 ， 以 加 快 其 执行 速度 。 


2.11 条 件 表 达 式 
下 面 这 组 语句 : 
if (a >b) 





























z= a; else 


z=b; 


HTK a Mb 中 的 最 大 值 ， 并 将 结果 保存 到 z 中 。 条 件 表 达 式 (使 用 三 
? :") 提 供 了 男 外 一 种 方法 编写 这 段 程序 及 类 似 的 代码 段 ， 在 
工 





exprl ? expr2 : expr3 


中 ， 首 先 计 算 expr1， 如 果 其 值 不 等 于 O(N), Wit expr2 的 值 ， 并 
以 该 值 作为 条 件 表达 式 的 值 ， 否 则 计算 expr3 的 值 ， 并 以 该 值 作为 条 件 
表达 式 的 值 。expr2 与 expr3 中 只 能 有 一 个 表达 式 被 计算 。 因 此 ， 以 上 
语句 可 以 改写 为 : 


z=(a>b)?a:b; /* z= max(a, b) */ 

应 该 注意 ， 条 件 表 达 式 实际 上 就 是 一 种 表达 式 ， 它 可 以 用 在 其 它 表 达 式 
可 以 使 用 的 任何 地 方 ;如 果 expr2 与 expr3 的 类 型 不 同 ， 结 果 的 类 型 将 由 
本 章 前 面 讨 论 的 转换 规则 决定 。 例 如 ， 如 果 f 为 float KE, nX int 类 
A, MARIA 

(n>0)?f:n 


是 float 类 型 ， 与 n 是 否 为 正 值 无 关 。 条 件 表达 式 中 第 一 个 表达 式 两 边 
的 圆 括号 并 不 是 必须 的 ， 这 是 因为 条 件 运算 符 ? 的 优先 


级 非常 低 ， 仅 高 于 赋值 运算 符 。 但 我 们 还 是 建议 使 用 圆 括号 ， 因 为 这 可 
以 使 表达 式 的 条 件 部 


分 更 易于 阅读 。 

采用 条 件 表达 式 可 以 编写 出 很 简洁 的 代码 。 例 如 ， 下 面 的 这 个 循环 语句 
打印 一 个 数组 的 n 个 元 素 ， 每 行 打印 10 个 元 素 ， 每 列 之 间 用 一 个 空格 
隅 开 ， 每 行 用 一 个 换行 符 结 束 (包括 最 后 一 行 ): 


for (i = 0; i < n; i++) 





























printf("%6d%c", ali], (i%10==9 II i==n°1) ?An' 


在 每 10 个 元 系 之 后 以 及 在 第 n 个 元 系 之 后 部 要 打印 一 个 换行 从 ， 所 有 
其 它 元 素 后 都 要 打印 一 个 空格 。 编 写 这 样 的 代码 可 能 需要 一 些 技巧 ， 
A ee Mae aye 
好 的 例子 : 


printf("You have %d item%s.\n", n, n==1 ? "" : "s"); 


练习 2°10 重新 编写 将 大 写字 母 转换 为 小 写字 母 的 函数 lower， 并 用 条 件 
表达 式 蔡 代 其 中 的 ifeelse 结构 。 


2.12 运算 从 优先 级 与 求 值 次 序 





K 21 忌 结 了 所 有 运算 符 的 优先 级 与 结合 性 ， 其 中 的 一 些 规 则 我 们 还 没 
有 讲述 。 同 一 行 中 的 各 运算 符 具 有 相同 的 优先 级 ， 各 行 间 从 上 往 下 优 
先 级 逐 行 降低 。 例 如 ，*、/ 与 % 三 者 具有 相 同 的 优先 级 ， 它 们 的 优先 级 
ABEL UIST io ISAT ) 表 示范 数 调用 。 运 算 符 *> 和 . 用 于 访 
问 结构 成 员 ， 第 6 章 将 讨论 这 两 个 运算 符 以 及 sizeof( 对 象 长 度 ) 运 算 
符 。 第 5 章 将 


讨论 运算 符 *( 通 过 指针 间接 访问 ) 与 &( 对 象 地 址 )， 第 3 章 将 讨论 逗号 运 
算 符 。 


#291 运算 符 的 优先 级 与 结合 性 
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高 。 
注意 ， 位 运算 符 &、 人 ^ 与 | 的 优先 级 比 运算 符 == 与 != 的 低 。 这 意味 着 ， 位 
测试 表达 式 ， 如 


从 


if (x & MASK) == 0)... 

必须 用 圆 括号 括 起 来 才能 得 到 正确 结果 。 

同 大 多 数 语言 一 样 ，C 语言 没有 指定 同一 运算 符 中 多 个 操作 数 的 计算 顺 
序 (&&、||、? 和 ,运算 符 除 外 )。 例 如 ， 在 形 如 

x= f() + g0; 


的 语句 中 ，f0) 可 以 在 g0 之 前 计算 ， 也 可 以 在 g80 之 后 计算 。 因 此 ， 如 果 
KZ fE g 改变 了 男 一 个 函数 所 使 用 的 变量 ， 那 么 x 的 结果 可 能 会 依赖 
于 这 两 个 函数 的 计算 顺序 。 为 了 保证 特定 的 计算 顺序 ， 可 以 把 中 间 结 
果 保 存在 临时 变量 中 。 


类 似 地 ，C 语言 也 没有 指定 函数 各 参数 的 求 值 顺序 。 因 此 ， 下 列 语 名 
printf("%d %d\n", ++n, power(2, n)); /* 错 */ 

在 不 同 的 编译 嚣 中 可 能 会 产生 不 同 的 结果 ， 这 取决 于 n 的 自 增 运算 在 
power 调用 之 前 还 是 之 后 执行 。 解 决 的 办 法 是 把 该 语句 改写 成 下 列 形 


re 














十 十 ]; 
printf("%d %d\n", n, power(2, n)); 


PABA. REEE, AS eB ide Se A By Bere EEEH” 
一 一 在 对 表达 式 求 值 的 同时 ， 修 改 了 茶 些 变量 的 值 。 在 有 副作用 影响 
的 表达 式 中 ， 其 执行 结果 同 表 达 式 中 的 变量 被 修改 的 顺 厅 之 间 存 在 看 
微妙 的 依赖 关系， 下列 语句 束 是 一 个 典型 的 令 人 不 愉快 的 情况 : 


ali] = i++; 


问题 是 :数组 下 标 i 是 引用 旧 值 还 是 引用 新 值 ?对 这 种 情况 编译 器 的 解释 

可 能 不 同 ， 并 因此 产生 不 同 的 结果 。C 语言 标准 对 大 多 数 这 类 问题 有 意 
未 作 具 体 规定 。 表 达 式 何 时 会 产生 这 种 副 作用 (对 变量 赋值 )， 将 由 编译 
虱 决 定 ， 因 为 最 佳 的 求 值 顺 序 同 机 旨 结 构 有 很 大 关系 。(ANSIC 标准 明 
确 规定 了 所 有 对 参数 的 副作用 都 必须 在 函数 调用 之 前 生效 ， 但 这 对 前 面 


介绍 的 printf 














函数 调用 没有 什么 帮助 。) 


在 任何 一 种 编程 语言 中 ， 如 果 代 码 的 执行 结果 与 求 值 顺序 相关 ， 则 都 是 
不 好 的 程序 设计 风格 。 很 目 然 ， 有 必要 了 解 哪 些 问题 需要 避免 ， 但 
是 ， 如 果 不 知道 这 些 问 题 在 各 种 机 右上 是 如 何 解 决 的 ， 束 最 好 不 要 尝 
试 运用 茶 种 特殊 的 实现 方式 。 








hAon 十 yoy 

第 3 草 Fa Hill Vit 

程序 语言 中 的 控制 流 语 句 用 于 控制 各 计算 操作 执行 的 次 序 。 在 前 面 的 例 
子 中 ， 我 们 曾经 使 用 了 一 些 最 常用 的 控制 流 结构 。 本 章 将 更 详细 地 讲 
述 控 制 流 语句 。 

3.1 语 名 与 程序 块 

在 X=0、i++ 或 printf(...) 这 样 的 表达 式 之 后 加 上 一 个 分 号 (;)， 它 们 就 变 
成 了 语句 。 例 如: 

x= 0; i++; 

printf(...); 

在 C 语言 中 ， 分 号 是 语句 结束 符 ， 而 Pascal 等 语言 却 把 分 号 用 作 语句 
之 间 的 分 隔 符 。 用 一 对 花 括 号 “ { 与 “把 一 组 声明 和 语句 括 在 一 起 就 
构成 了 一 个 复合 语句 (也 叫 作 


程序 块 )， 复 合 语 句 在 语法 上 等 价 于 单条 语句 。 函 数 体 中 被 花 括 号 括 起 
来 的 语句 便 是 明显 一 例 。 


if. else, while 与 for 之 后 被 花 括号 括 住 的 多 条 语句 也 是 类 似 的 例子 。 
(在 任何 程序 块 中 都 可 以 声明 变量 ， 第 4 章 将 对 此 进行 讨论 。) 右 花 括 号 
用 于 结束 程序 块 ， 其 后 不 需要 分 号 。 








3.2 ifeelse if 4J 

if*else 语句 用 于 条 件 判定 ， 其 语法 如 下 所 示 : 
if {表达 式 } 

语句 1 


else 


语句 2 

其 中 else 部 分 是 可 选 的 。 该 语句 执行 时 ， 先 计算 表达 式 的 值 ， 如 果 其 值 
为 真 ( 即 表 达 式 的 值 为 非 0)， 则 执行 语句 1 如果 其 值 为 假 ( 即 表 达 式 的 值 
为 0)， 并 且 该 语句 包含 else 部 分 ， 则 执行 语句 2. 


由 于 让 语句 只 是 简单 测试 表达 式 的 数值 ， 因 此 可 以 对 某 些 代码 的 编写 进 
行 简 化 。 最 明显 的 例子 是 用 如 下 写法 


if (表达 式 ) 

RANE 

if (表达 式 !0) 

某 些 情况 下 这 种 形式 是 自然 清晰 的 ， 但 也 有 些 情 况 下 可 能 会 含义 不 清 。 
为 ifeelse 语句 的 else 部 分 是 可 选 的 ， 所 以 在 挫 套 的 证 语句 中 省 略 它 的 


else 部 分 将 导 臻 歧义。 解决 的 方法 是 将 每 个 else 与 最 近 的 前 一 个 没有 
else Ac xt AY if BEAT DC BC. 





例如 ， 在 下 列 语句 中 : 
if (n > 0) 

if (a >b) 

z= a; else 

z =b; 


else 部 分 与 内 层 的 让 匹配 ， 我 们 通过 程序 的 缩 进 络 构 也 可 以 看 出 来 。 如 
果 这 不 符合 我 们 的 意图 ， 则 必须 使 用 花 括 号 强制 实现 正确 的 匹配 关系 : 


if (n > 0) {if (a >b) 


else 

z = b; 

歧义 性 在 下 面 这 种 情况 下 尤为 有 害 : 
if (n > 0) 

for (i = 0; i < n; i++) if (s[i] > 0) { 
printf("..."); return i; 

} 

else /* WRONG */ 
printf("error ** n is negative\n"); 


Be Fe EY ei EZ a BP Ae ST, (Ao EAS CIE RA fa A, 
EA else 部 分 与 内 层 的 证 配对 。 这 种 错误 很 难 发 现 ， 因 此 我 们 建议 








EA if EREKE MEHER S o 

顺便 提醒 读者 注意 ， 在 语句 

if (a >b) 

Z = a; else 

z =b; 

中 ，z=a 后 有 一 个 分 号 。 这 是 因为 ， 从 语法 上 讲 ， 跟 在 证 后 面 的 应 该 


是 一 条 语句 ， 而 像 “ z=a;” 

这 类 的 表达 式 语句 总 是 以 分 号 结束 的 。 
3.3 elsesif 语句 

在 C 语言 中 我 们 会 经 常用 到 下 列 结构 : 
if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 

else if (表达 式 ) 

语句 

else 


语句 











因此 我 们 在 这 里 单独 说 明 一 下 。 这 种 站 语句 序列 是 编写 多 路 判定 最 常用 
的 方法 。 其 中 的 各 表 达 式 将 被 依次 求 值 ， 一 旦 茶 个 表达 式 结果 为 真 ， 
则 执行 与 之 相关 的 语句 ， 并 终止 整个 语句 序 列 的 执行 。 同 样 ， 其 中 各 
语句 既 可 以 是 单条 语句 ， 也 可 以 是 用 花 括 号 括 住 的 复合 语句 。 


最 后 一 个 else 部 分 用 于 处 理 " 上 述 条 件 均 不 成 立 "的 情况 或 默认 情况 ， 也 
就 是 当 上 面 各 条 件 都 不 满足 时 的 情形 。 有 时 候 并 不 需要 针对 默认 情况 
执行 显 式 的 操作 ， 这 种 情况 下 ， 可 以 把 该 结构 末尾 的 





else 
fA) 


BOD a HR Pe Za a} tH AY DA RAR, DATARS AT BE" HRTF X 
里 通过 一 个 折 半 查找 函数 说 明 三 路 判定 程序 的 用 法 。 该 函数 用 于 判定 已 
排序 的 数组 v 


中 是 否 存 在 某 个 特定 的 值 x。 数 组 v 的 元 素 必须 以 升序 排列 。 如 果 v 中 
含 Xx， 则 该 函数 返回 


x 在 Vv 中 的 位 置 ( 介 于 Omel 之 间 的 一 个 整数 ); 否 则 ， 该 函数 返回 ,1。 


在 折 半 查找 时 ， 首 先 将 输入 值 x 与 数组 v 的 中 间 元 素 进 行 比 较 。 如 果 x 
小 于 中 间 元 素 的 值 ， 则 在 该 数组 的 前 半 部 分 查找 ;人 否则， 在 该 数组 的 后 
半 部 分 碍 找 。 在 这 两 种 情况 下 ， 下 一 步 都 是 将 X 与 所 选 部 分 的 中 间 元 
素 进行 比较 。 这 个 过 程 一 二 进 行 下 去 ， 直 到 找到 指定 的 值 或 奋 找 范围 


AVE o 


/* binsearch: find x in v[O] <= v[1] <=... <= v[ne1] */ int 
binsearch(int x, int v[], int n) 











{ 
int low, high, mid; 
low = 0; 


high =n 1; 


while (low <= high) { mid = (low+high)/2; if (x < v[mid]) 
high = mid + 1; else if (x > v[mid]) 


low = mid + 1; 


else /* found match */ return mid; 
} 

return 1; /* no match */ 

} 








该 函数 的 基本 判定 是 :在 每 一 步 判断 X 小 于 、 大 于 还 是 等 于 中 间 元 素 
vimid]. FH else*if 结构 执行 这 种 判定 很 自然 。 


练习 3*1 FE LMA KEARNS +H, while 循环 语句 内 共 执 行 了 两 
次 测试 ， 其 实 只 要 一 次 就 足 够 (代价 是 将 更 多 的 测试 在 循环 外 执行 )。 重 
Re RA 
行 时 间 。 


3.4 switch if fJ 


switch 语句 是 一 种 多 路 判定 语句 ， 它 测试 表达 式 是 否 与 一 些 常 量 整数 值 
中 的 某 一 个 值 匹 配 ， 并 执行 相应 的 分 支 动 作 。 





switch (表达 式 ) { 
case 常量 表达 式 : 语句 序列 
case 常量 表达 式 : 语句 序列 
default: 语句 序列 


每 一 个 分 支 都 由 一 个 或 多 个 整数 值 常 量 或 常量 表达 式 标 记 。 如 果菜 个 分 
文 与 表达 式 的 值 匹配 ， 则 从 该 分 支 开 始 执 行 。 各 分 支 表 达 式 必须 互 不 
相同 。 如 果 没 有 哪 一 分 支 能 匹配 表达 式 ， 则 执 行 标记 为 default 的 分 
Xo default 分 文 是 可 选 的 。 如 果 没 有 default 分 支 也 没有 其 它 分 LIK 
达 式 的 值 匹配 ， 则 该 switch 语句 不 执行 任何 动作 。 各 分 支 及 default 分 
支 的 排列 次 序 是 任意 的 。 


我 们 在 第 1 章 中 曾 用 if...else if...else 结构 编写 过 一 个 程序 以 统计 各 个 数 
字 、 衬 和 白 符 及 其 它 所 有 字符 出 现 的 次 数 。 下 面 我 们 用 switch 语句 改写 
该 程序 如 下 : 














#include <stdio.h> 

main() /* count digits, white space, others */ 

{ 

int c, i, nwhite, nother, ndigit[10]; 

nwhite = nother = 0; 

for (i = 0; i < 10; i++) ndigit[i] = 0; 

while ((c = getchar()) != EOF) { switch (c) { 

case '0': case '1': case '2': case '3': case '4': 

case '5': case '6': case '7': case '8': case '9': ndigit[ce'0']++; 


break; case '': 


case \n': 

case ‘\t': 

nwhite++; break; 

default: 

nother++; break; 

} 

} 

printf("digits ="); 

for (i = 0; i < 10; i++) printf(" %d", ndigit[i]); 

printf(", white space = %d, other = %d\n", nwhite, nother); 

return 0; 

} 

break 语句 将 导致 程序 的 执行 立即 从 switch 语句 中 退出 。 在 switch 语句 
HH, case 的 作用 只 是 一 个 标号 ， 因 此 ， 某 个 分 支 中 的 代码 执行 完 后 ， 程 
序 将 进入 下 一 分 文 继续 执行 ， 除非 在 程序 中 显 式 地 跳 转 。 跳 出 switch 
语句 最 常用 的 方法 是 使 用 break 语句 与 return 语 ©). break 语句 还 可 强 
制 控制 从 while. for 与 do 循环 语句 中 立即 退出 ， 对 于 这 一 点 ， 我 们 稍 
后 还 将 做 进一步 介绍 。 

依次 执行 各 分 文 的 做 法 有 优点 也 有 缺点 。 好 的 一 面 是 它 可 以 把 若干 个 分 


文 组 合 在 一 起 完 成 一 个 任务 ， 如 上 例 中 对 数字 的 处 理 。 但 是 ， 正 常情 
况 下 为 了 防止 直接 进入 下 一 个 分 文 执行 ， 








每 个 分 支 后 必须 以 一 个 break 语句 结束 。 从 一 个 分 支 直接 进入 下 一 个 分 
支 执行 的 做 法 并 不 健 全 ， 这 样 做 在 程序 修改 时 很 容易 出 错 。 除 了 一 个 
计算 需要 多 个 标号 的 情况 外 ， 应 尽量 减少 从 一 个 分 支 直 接 进 入 下 一 个 
分 支 执行 这 种 用 法 ， 在 不 得 不 使 用 的 情况 下 应 该 加 上 适当 的 程序 注 
RK. 











作为 一 种 良好 的 程序 设计 风格 ， 在 switch 语句 最 后 一 个 分 支 ( 即 default 
分 支 ) 的 后 面 也 加 上 一 个 break 语句 。 这 样 做 在 逻辑 上 没有 必要 ， 但 当 
我 们 需要 回访 switch 语句 后 添 加 其 它 分 文 时 ， 这 种 防范 措施 会 降低 犯 
错误 的 可 能 性 。 

练习 3。2 编写 一 个 函数 escape(s, t)， 将 字符 串 t 复制 到 字符 串 s 中 ， 并 
在 复制 过 程 中 将 换行 符 、 制 表 符 等 不 可 见 字 符 分 别 转 换 为 n、\t 等 相应 
的 可 见 的 转 义 字符 序列 。 要 求 使 用 swich 语句 。 再 编写 一 个 具有 相反 功 
能 的 函数 ， 在 复制 过 程 中 将 转 义 字符 序列 转换 为 实际 字符 。 

3.5 while 盾 不 与 for 盾 不 

我 们 在 前 面 已 经 使 用 过 while 与 for 循环 语句 。 在 while 循环 语句 

while (表达 式 ) 

语句 

中 ， 首 先 求 表 达 式 的 值 。 如 果 其 值 非 0， 则 执行 语句 ， 并 再 次 求 该 表达 
式 的 值 。 这 一 循环 过 程 一 直 进 行 下 去 ， 直 到 该 表达 式 的 值 为 0 WIE, 
随后 继续 执行 语句 后 面 的 部 分 。 

for 循环 语句 ; 

for (表达 式 1; KIAR 2; 表达 式 3) 

语句 

它 等 价 于 下 列 while 语句 : 表达 式 1; 

while (表达 式 2) { 











aA) 
表达 式 3; 
} 


但 当 while 或 for 循环 语句 中 包含 continue 语句 时 ， 上 述 二 者 之 间 就 不 
一 定 等 价 了 。 我 们 将 在 3.7 节 中 介绍 continue 语句 。 


从 语法 角度 看 ，for 循环 语句 的 3 个 组 成 部 分 都 是 表达 式 。 最 第 见 的 情 
况 是 ， 表 达 式 1 


与 表达 式 3 是 赋值 表达 式 或 函数 调用 ， 表 达 式 2 是 关系 表达 式 。 这 3 个 
组 成 部 分 中 的 任何 部 


分 都 可 以 省 略 ， 但 分 号 必须 保留 。 如 果 在 for 语句 中 省 略 表 达 式 1 与 表 
IATL 3， 它 就 退化 成 


了 while 循环 语句 。 如 果 省 略 测 试 条 件 ， 即 表达 式 2， 则 认为 其 值 永 远 
是 真 值 ， 因 此 ， 下 列 


for 循环 语句 : 
for (;;) { 





} 


是 一 个 "无 限 "循环 语句 ， 这 种 语句 需要 借助 其 它 手 段 (如 break 语句 或 
return 语句 ) 才 能 终止 执行 。 


在 设计 程序 时 到 底 选 用 while 循环 语句 还 是 for 循环 语句 ， 主 要 取决 于 
程序 设计 人 员 的 


个 人 偏好 。 例 如 ， 在 下 列 语句 中 : 
while ((c = getchar()) ==" "||c=="\n'||c="\t) 
/* skip white space characters */ 


因为 其 中 没有 初始 化 或 重新 初始 化 的 操作 ， 所 以 使 用 while 循环 语句 更 
目 然 一 些 。 如 果 语 句 中 需要 执行 简单 的 初始 化 和 变量 递增 ， 使 用 for 语 
句 更 合适 一 些 ， 它 将 循环 控 


制 语句 集中 放 在 循环 的 开头 ， 结 构 更 芭 凑 、 更 清晰 。 通 过 下 列 语句 可 以 
很 明显 地 看 出 这 一 点 : 


for (i = 0; i < n; i++) 


这 是 C 语言 处 理 数 组 前 n AmA EA, ERAF Fortran 
语言 中 的 DO 循环 或 Pascal 语言 中 的 for 循环 。 但 是 ， 这 种 类 比 并 不 完 
全 准确 ， 因 为 在 C 语言 中 ，for 循环 语句 的 循环 变量 和 上 限 在 循环 体内 
可 以 修改 ， 并 且 当 循环 因 某 种 原因 终止 后 循环 变量 i 的 值 仍 然 保留 。 因 
为 for 语句 的 各 组 成 部 分 可 以 是 任何 表达 式 ， 所 以 for 语句 并 不 限于 通 
过 算术 级 数 进行 循环 控制 。 尽 管 如 此 ， 它 强 地 把 一 些 无 关 的 计算 放 到 
for 语句 的 初始 化 和 变量 递增 部 分 是 一 种 不 好 的 程序 设计 风格 ， 该 部 分 
放置 循环 控制 运算 更 合适 。 


作为 一 个 较 大 的 例子 ， 我 们 来 重新 编写 将 字符 串 转换 为 对 应 数值 的 函数 
atoi。 这 里 编写 的 函数 比 第 2 章 中 的 atoi 函数 更 通用 ， 它 可 以 处 理 可 选 
的 前 导 空白 符 以 及 一 个 可 选 的 加 (+) 或 减 (-) 写 。( 第 4 章 将 介绍 函数 
atof， 筷 用 于 对 译 点 数 执行 同样 的 转换 。) 


下 面 是 程序 的 结构 ， 从 中 可 以 看 出 输入 的 格式 : 

如 果 有 空白 符 的 话 ， 则 跳 过 如 果 有 符号 的 话 ， 则 读 取 符 号 取 整 数 部 
分 ， 并 执行 转换 

其 中 的 每 一 步 都 对 输入 数据 进行 相应 的 处 理 ， 并 为 下 一 步 的 执行 做 好 准 
备 。 当 遇 到 第 一 个 不 能 转换 为 数字 的 字符 时 ， 整 个 处 理 过 程 终止。 





#include <ctype.h> 

/* atoi: convert s to integer; version 2 */ int atoi(char s[]) 
{ 

int i, n, sign; 


for (i = 0; isspace(s[i]); i++) /* skip white space */ 


sign = (s[i] == '*') ? °1 : 1; 

if (s[i] == '+' || s[i] == "*") /* skip sign */ i++; 
for (n = 0; isdigit(s[i]); i++) 

n= 10 * n + (s[i] ° '0'); return sign * n; 

} 


标准 库 中 提供 了 一 个 更 完善 的 函数 strtol， 它 将 字符 串 转 换 为 长 整 型 
Bl. AKAMA strtol 


的 详细 信息 ， 请 参见 附录 B.S 节 。 


把 循环 控制 部 分 集中 在 一 起 ， 对 于 多 重 藤 套 循 环 ， 优 势 更 为 明显 。 下 面 
的 函数 是 对 整 型 数组 进行 排序 的 Shell 排序 算法 。Shell 排序 算法 是 D. 
L. Shell 于 1959 年 发 明 的 ， 其 基本 思想 是 : 先 比 较 距 离 远 的 元 素 ， 而 不 
古 像 简 单 交 换 排序 算法 那样 先 比 较 相 邻 的 元 系 。 这 样 可 以 快 














速 减 少 大 量 的 无 序 情况 ， 从 而 减轻 后 续 的 工作 。 被 比较 的 元 素 之 间 的 距 
离 逐 步 减少 ， 直 到 减 少 为 1， 这 时 排序 变 成 了 相 邻 元 素 的 互 换 。 





/* shellsort: sort v[O]...v[ne1] into increasing order */ void 
shellsort(int v[], int n) 


{ 

int gap, i, j, temp; 

for (gap = n/2; gap > 0; gap /= 2) for (i = gap; i < n; i++) 
for (j=i*gap; j>=0 && v[j]>v[j+gap]; j*=gap) { temp = vlj]; 
vlj] = vij+gap]; vlj+gap] = temp; 

} 

} 


Rea ae T= SURE IN for 循环 语句 。 最 外 层 的 for 语句 控制 两 
个 被 比较 元 素 之 间 的 距离 ， 从 m2 开始 ， 逐 步 进 行 对 折 ， 直 到 距离 为 
0。 中 间 层 的 for 循环 语句 用 于 在 元 素 间 移 动 位 置 。 最 内 层 的 for 语句 用 
于 比较 各 对 相距 gap 个 位 置 的 元 素 ， 当 这 两 个 元 素 逆序 时 把 它 们 互 换 过 
来 。 由 于 gap 的 值 最 终 要 递减 到 1， 因 此 所 有 元 素 最 终 都 会 位 于 正确 的 
排序 位 置 上 。 注意 ， 即 使 最 外 层 for 循环 的 控制 变量 不 是 算术 级 数 ，for 
语句 的 书写 形式 仍然 没有 变 ， 这 就 说 明 for 语句 具有 很 强 的 通用 性 。 


SISA "he C 语言 优先 级 最 低 的 运算 符 ， 在 for 语句 中 经 常会 用 
IE. BIE 号 分 隅 的 一 对 表达 式 将 按照 从 左 到 右 的 顺序 进行 求 值 ， 表 
达 式 右边 的 操作 数 的 类 型 和 值 即 为 其 结果 的 类 型 和 值 。 这 样 ， 在 for 循 
环 语句 中 ， 可 以 将 多 个 表达 式 放 在 各 个 语句 成 分 中 ， 比 如 同时 处 理 两 
个 循环 控制 变 晕 。 我 们 可 以 通过 下 面 的 函数 reverse(s) 来 举例 。 该 函数 用 
于 倒置 字符 串 s 中 各 个 字符 的 位 置 。 























#include <string.h> 


/* reverse: reverse string s in place */ void reverse(char s[]) 


int c, i, j; 

for (i = 0, j = strlen(s)*1; i < j; i++, jee) { c = sli]; 

s[i] = slj]; s[j] = c; 

} 

} 

某 些 情况 下 seed irate 号 运算 符 ， 比 如 分 隅 函数 参数 的 逗号 ， 分 陋 
声明 中 变量 的 逗号 等 ， 这 些 逗 号 并 不 保证 各 表达 式 按 从 左 至 右 的 | 顺序 
求 值 。 

MIATA Sie. WS o 于 关系 紧密 的 结构 中 ， 比 如 上 
面 的 reverse Ki 数 内 的 for 语句 ， 对 于 需 ;要 在 单个 表达 式 中 进行 多 步 计 


算 的 宏 来 说 也 很 适合 。 PAE 适用 于 reverse 函数 中 元 素 的 交 
换 ， 这 样 ， 元 素 的 交换 过 程 便 可 以 看 成 是 一 个 单 步 操作 。 


for (i = 0, j = strlen(s)°1; i < j; i++, jee) c = s[i], sli] = s[j], sj] = c; 


fae a A 编写 函数 expand(s1, s2)， 将 字符 串 s1 中 类 似 于 az 一 类 






































在 字符 串 s2 中 扩展 为 等 价 的 完整 列表 abc...xyz。 该 函数 可 以 处 理 大 小 
写字 母 和 数字 ， 并 可 以 处 理 aeb*c、ae*z0*9 与 az 等 类 似 的 情况 。 作 为 
前 导 和 尾随 的 字符 原样 排 印 。 


3.6 doewhile 盾 不 


我 们 在 第 1 PBA, while 与 for 这 两 种 循环 在 循环 体 执行 前 对 终 
止 条 件 进行 测 试 。 与 此 相反 ，C 语言 中 的 第 三 种 循环 一 一 do*while 循环 
则 在 循环 体 执行 后 测试 终止 条 件 ， 这 样 循 环 体 至 少 被 执行 一 次 。 


do*while 循环 的 语法 形式 如 下 : 
do 

语句 

while (表达 式 ); 


在 这 一 结构 中 ， 先 执行 循环 体 中 的 语句 部 分 ， 然 后 再 求 表 达 式 的 值 。 如 
果 表 达 式 的 值 为 真 ， 则 再 次 执行 语句 ， 依 此 类 推 。 当 表达 式 的 值 变 为 
假 ， 则 循环 终止 。 除 了 条 件 测试 的 语义 不 同 外 ，do*while 循环 与 Pascal 


语言 的 repeateuntil 语句 等 价 。 


经 验 表 明 ，do*while 循环 比 while 循环 和 for 循环 用 得 少 得 多 。 尽 管 如 
此 ，do*while 循环 语句 有 时 还 是 很 有 用 的 ， 下 面 我 们 通过 函数 itoa 来 说 
明 这 一 点 。itoa 函数 是 atoi 函 数 的 逆 函 数 ， 它 把 数字 转换 为 字符 串 。 这 
个 工作 比 最 初 想像 的 要 复杂 一 些 。 如 果 按 照 atoi K 数 中 生成 数字 的 方 
法 将 数字 转换 为 字符 串 ， 则 生成 的 字符 串 的 次 序 正好 是 颠倒 的 ， 因 此 ， 
我 们 首先 要 生成 有 反 序 的 字符 串 ， 然 后 再 把 该 字符 串 倒置 。 








/* itoa: convert n to characters in s */ void itoa(int n, char s[]) 
{ 
int i, sign; 


if ((sign = n) < 0) /* record sign */ 


n= en; /* make n positive */ i = 0; 


do { /* generate digits in reverse order */ s[i++] =n % 10 + 
'0'; /* get next digit */ 

} while ((n /= 10) > 0); /* delete it */ if (sign < 0) 

sli++] = "5 


s[i] = '\0'; reverse(s); 
} 


这 里 有 必要 使 用 doewhile 语句 ， 至 少 使 用 do*while 语句 会 方便 一 些 ， 
为 即使 n 的 值 为 0， 也 至 少 要 把 一 个 字符 放 到 数组 s 中 。 其 中 的 
do*while 语句 体 中 只 有 一 条 语句 ， 尽 管 没有 必要 ， 但 我 们 仍然 用 花 括号 
将 该 语句 括 起 来 了 ， 这 样 做 可 以 避免 草率 的 读者 将 while 部 分 误 认为 是 
另 个 while 循环 的 开始 。 

练习 3.4 ”在 数 的 对 二 的 补 码 表 示 中 ， 我 们 编写 的 itoa 函数 不 能 处 理 最 


大 的 负数 ， 即 n 等 于 "2 **…! 的 情况 。 请 解释 其 原因 。 修 改 该 函数 ， 使 它 
在 任何 机 器 上 运行 时 都 能 打印 出 正确 的 值 。 


练习 3.5 编写 函数 itob(n, s, b)， 将 整数 mn 转换 为 以 b 为 底 的 数 ， 
并 将 转换 结果 


以 字符 的 形式 保存 到 字符 串 s 中 。 例 如 ，itob(n, s, 16) 把 整数 n 格式 化 成 
十 六 进 制 整数 保存 在 s 中 。 


练习 3*6 修改 itoa 函数 ， 使 得 该 函数 可 以 接收 三 个 参数 。 其 中 ， 第 三 个 
参数 为 最 小 字段 宽度 。 为 了 保证 转换 后 所 得 的 结果 至 少 具 有 第 三 个 参 
数 指定 的 最 小 宽度 ， 在 必要 时 应 在 所 得 结果 的 左边 填充 一 定 的 空格 。 


3.7 break 语句 与 continue 语句 


不 通过 循环 头 部 或 尾部 的 条 件 测 试 而 跳出 循环 ， 有 时 是 很 方便 的 。 
break 语句 可 用 于 从 for. while 与 do*while 等 循环 中 提前 退出 ， 就 如 同 
从 switch 语句 中 提前 退出 一 样 。break 语句 能 使 程序 从 switch 语句 或 最 
内 层 循环 中 立即 跳出 。 


下 面 的 函数 trim 用 于 删除 字符 串 尾 部 的 空格 符 、 制 表 符 与 换行 待 。 当 发 
现 最 右边 的 字符 为 非 空 格 符 、 非 制 表 符 、 非 换行 符 时 ， 融 使 用 break 语 
句 从 循环 中 退出 。 

















/* trim: remove trailing blanks, tabs, newlines */ int trim(char s[]) 

{ 

int n; 

for (n = strlen(s)*1; n >= 0; nee) 

if (s[n] !='' && s[n] {= \t' && s[n] != n’) break; 

s[n+1] = '\0'; 

return n; 

} 

strlen 图 数 返 回 字符 串 的 长 度 。for 循环 从 字符 串 的 末尾 开始 反方 癌 扫 描 


寻找 第 一 个 不 是 空格 符 、 制 表 符 以 及 换行 符 的 字符 。 当 找到 符合 条 件 
的 第 一 个 字符 ， 或 当 循 环 控制 变量 n 变 为 负数 时 ( 即 整 个 字符 串 都 被 扫 











描 完 时 )， 循 环 终止 执行 。 读 者 可 以 验证 ， 即 使 字符 串 为 空 RARE 
日 符 ， 该 函数 也 是 正确 的 。 


continue 语句 与 break 语句 是 相关 联 的 ， 但 它 没 有 break 语句 常用 。 
continue 语 句 用 于 使 fors while 或 doewhile 语句 开始 下 一 次 循环 的 执 
行 。 在 while 与 doewhile 语句 中 ，continue 语句 的 执行 意味 着 立即 执行 
测试 部 分 ;在 for 循环 中 ， 则 意味 着 使 控制 转移 到 递增 循环 变量 部 分 。 
continue 语句 只 用 于 循环 语句 ， 不 用 于 switch 语句 。 某 个 循环 包含 的 
switch 语句 中 的 continue 语句 ， 将 导致 进入 下 一 次 循环 。 


例如 ， 下 面 这 段 程序 用 于 处 理 数组 a 中 的 非 负 元 素 。 如 果 某 个 元 素 的 值 
为 负 ， 则 跳 过 不 处 理 。 


for (i = 0; i < n; i++) 








if (ali] < 0) /* skip negative elements */ continue; 
... /* do positive elements */ 


“4 ESA EY Jes TB oy LER RIN, SFB continue 语句 。 这 种 情况 
下 ， 如 果 不 使 用 continue 语句 ， 则 可 能 需要 把 测试 颠倒 过 来 或 者 缩 进 另 
一 层 循 环 ， 这 样 做 会 使 程序 的 组 套 更 深 。 








3.8 goto 语 旬 与 标号 


C 语言 提供 了 可 随意 滥用 的 goto 语句 以 及 标记 跳 转 位 置 的 标号 。 从 理论 
EY, goto 语 句 是 没有 必要 的 ， 实 践 中 不 使 用 goto 语句 也 可 以 很 容易 
地 写 出 代码 。 至 此 ， 本 书 中 还 没有 使 用 goto 语句 。 


Bæ EREJE F goto 语句 还 是 用 得 着 的 。 最 常见 的 用 法 古 终止 程 
FREE FREE VR EE 的 结构 中 的 处 理 过程 ， 例 如 一 次 跳出 两 层 或 多 层 循 
环 。 这 种 情况 下 使 用 break 语句 是 不 能 达 到 目的 的 ， 它 只 能 从 最 内 层 循 
环 退出 到 上 一 级 的 循环 。 下 面 是 使 用 goto 语句 的 一 个 例子 : 


for (...) 

















for (...) { 


if (disaster) goto error; 


} 


error: 


/* clean up the mess */ 


在 该 例子 中 ， 如 果 错 误 处 理 代码 很 重要 ,并且 错误 可 能 出 现在 多 个 地 
方 ， 使 用 goto 语句 将 会 比较 方便 。 


标号 的 命名 同 变 量 命名 的 形式 相同 ， 标 号 的 后 面 要 紧 跟 一 个 冒号 。 标 号 
可 以 位 于 对 应 的 


goto 语句 所 在 函数 的 任何 语句 的 前 面 。 标 号 的 作用 域 是 整个 函数 。 


MPK 
我 们 来 看 另外 一 个 例子 。 考 虑 判定 两 个 数组 a 与 b 中 是 人 否 具 有 相同 元 率 
的 问题 。 一 种 可 能 的 解决 方法 是 : 








for (i = 0; i < n; i++) for (j = 0; j < m; j++) 
if (ali] == b[j]) goto found; 


/* didn't find any common element */ 


found: 


/* got one: ali] == b[j] */ 


所 有 使 用 了 goto 语句 的 程序 代码 都 能 改写 成 不 带 goto 语句 的 程序 ， 但 
可 能 会 增加 一 些 额外 的 重复 测试 或 变量 。 例 如 ， 可 将 上 面 判定 是 否 具 
有 相同 数组 元 素 的 程序 段 改写 成 下 列 形 式 : 

found = 0; 

for (i = 0; i < n && !found; i++) for (j = 0; j < m && ! found; j++) 

if (aLi] == b[j]) found = 1; 

if (found) 


/* got one: alie1] == b[j*1] */ 


else 


/* didn't find any common element */ 


大 多 数 情况 下 ， 使 用 goto 语句 的 程序 段 比 不 使 用 goto 语句 的 程序 段 要 
难以 理解 和 维护 ， 少数 情况 除外 ， 比 如 我 们 前 面 所 举 的 几 个 例子 。 尽 
管 该 问题 并 不 太 严 重 ， 但 我 们 还 是 建议 尽 可 能 少 地 使 用 goto 语句 。 


第 4 章 图 数 与 程序 结构 


函数 可 以 把 大 的 计算 任务 分 解 成 右 干 个 较 小 的 任务 ， 程 序 设计 人 员 可 以 
基于 函数 进一步 构造 程序 ， 而 不 需要 重新 编写 一 些 代码 。 一 个 设计 得 
当 的 函数 可 以 把 程序 中 不 需要 了 解 的 具 体操 作 细 市 隐藏 起 来 ， 从 而 使 
整个 程序 结构 更 加 清晰 ， 并 降低 修改 程序 的 难度 。 


C 语言 在 设计 中 考虑 了 函数 的 高 效 性 与 易 用 性 这 两 个 因素 。C 语言 程序 
一 般 都 由 许多 小 的 函数 组 成 ， 而 不 是 由 少量 较 大 的 函数 组 成 。 一 个 程 
序 可 以 保存 在 一 个 或 者 多 个 源 文件 中 。 各 个 文件 可 以 单独 编译 ， 并 可 
以 与 库 中 已 编译 过 的 函数 一 起 加 载 。 我 们 在 这 里 不 打算 详细 讨论 这 一 
过 程 ， 因 为 编译 与 加 载 的 具体 实现 细 市 在 各 个 编译 系统 中 并 不 相同 。 


ANSI 标准 对 C 语言 所 做 的 最 明显 的 修改 是 函数 声明 与 函数 定义 这 两 广 
面 。 第 1 章 中 我 们 曾经 讲 过 ， 目 前 C 语言 已 经 允许 在 声明 函数 时 声明 
参数 的 类 型 。 为 了 使 函数 的 声明 与 定义 相 适应 ，ANSI 标准 对 函数 定义 
的 语法 也 做 了 修改 。 基 于 该 原因 ， 编 译 器 就 有 可 能 检测 出 比 以 前 的 C 
语言 版 本 更 多 的 错误 。 并 且 ， 如 果 参 数 声明 得 当 ， 程 序 可 以 自动 地 进行 
适当 的 强制 类 型 转换 。 


ANSI 标准 进一步 明确 了 名 字 的 作用 域 规则 ， 特 别 要 求 每 个 外 部 对 象 只 
能 有 一 个 定义 。 初 始 化 的 适用 范围 也 更 加 广泛 了 ， 目 动 数组 与 结构 都 
可 以 进行 初始 化 。 


C 语言 预 处 理 的 功能 也 得 到 了 增强 。 新 的 预 处 理 器 包含 一 组 更 完整 的 条 
件 编译 指令 (一 种 通过 宏 参 数 创 建 带 引号 的 字符 串 的 方法 )， 对 宏 扩 展 过 
程 的 控制 更 严格 。 


4.1 函数 的 基本 知识 
首先 我 们 来 设计 并 编写 一 个 程序 ， 它 将 输入 中 包含 特定 "模式 "或 字符 串 


的 各 行 打 印 出 来 (这 是 UNIX 程序 grep 的 特例 ) 例 如 ， 在 下 列 一 组 文本 行 
中 查找 包含 字符 串 “ ould" 的 行 : 





Ah Love! could you and I with Fate conspire To grasp this sorry Scheme of 
Things entire, Would not we shatter it to bits «+ and then Re*mould it nearer 


to the Hearts Desirel 
程序 执行 后 输出 下 列 结 


Ah Love! could you and I with Fate conspire Would not we shatter it to bits 
ee and then Re*mould it nearer to the Heart's Desire! 


该 任务 可 以 明确 地 划分 成 下 列 3 部 分 : 

whiel (还 有 未 处 理 的 行 ) 

if (该 行 包含 指定 的 模式 ) 

打印 该 行 

尽管 我 们 可 以 把 所 有 的 代码 都 放 在 主 程序 main 中 ， 但 更 好 的 做 法 是 ， 


利用 其 结构 把 每 一 部 分 设计 成 一 个 独立 的 函数 。 分 别处 理 3 个 小 的 部 
分 比 处 理 一 个 大 的 整体 更 容易 ， 因 为 这 样 


可 以 把 不 相关 的 细 市 隐藏 在 函数 中 ， 从 而 减少 了 不 必要 的 相互 影响 的 机 
会 ， 并且， 这 些 函 数 也 可 以 在 其 它 程序 中 使 用 。 


我 们 用 函数 getline 实现 "还 有 未 处 理 的 行 "， 该 函数 已 在 第 1 章 中 介绍 
过 ;用 printf 函数 实现 "打印 该 行 "， 这 个 函数 是 现成 的 ， 别 人 已 经 提供 
了 。 也 就 是 说 ， 我 们 只 需要 编写 一 个 判定 "该 行 包含 指定 的 模式 "的 函 
数 。 


我 们 编写 函数 strindex(s, t) 实 现 该 目标 。 该 水 数 返 回 字 符 串 t EFFE s 
中 出 现 的 起 始 位 置 或 索引 。 当 s 不 包含 t 时 ， 返 回 值 为 1。 由 于 C 语言 
数组 的 下 标 从 0 开始 ， 下 标的 值 只 可 能 为 0 或 正 数 ， 因 此 可 以 用 像 *1 
这 样 的 负数 表示 失败 的 情况 。 如 果 以 后 需要 进行 更 复 杂 的 模式 匹配 ， 
只 需 蔡 换 strindex 函数 即 可 ， 程 序 的 其 余部 分 可 保持 不 变 。( 标 准 库 中 提 
供 的 库 函 数 strstr 的 功能 类 似 于 strindex 函数 ， 但 该 库 函 数 返回 的 是 指 
针 而 不 是 下 标 值 。) 


完成 这 样 的 设计 后 ， 编 写 整个 程序 的 细 市 束 直 截 了 当 了 。 下 面 列 出 的 就 
是 一 个 完整 的 程序 ， 读 者 可 以 伍 看 各 部 分 是 怎样 组 合 在 一 起 的 。 我 们 
现在 但 找 的 模式 是 字符 串 字 面值 ， 它 不 是 一 种 最 通用 的 机 制 。 我 们 在 
这 里 只 简单 讨论 字符 数组 的 初始 化 方法 ， 第 5 章 将 介绍 如 何在 程序 运 
行 时 将 模式 作为 参数 传递 给 函数 。 其 中 ，getline K CBC HI TAL FN WAS HE A 
EEN cre at T E E Soe 


#include <stdio.h> 

















#define MAXLINE 1000 /* maximum input line length */ 
int getline(char line[], int max) 

int strindex(char source[], char searchfor[]); 

char pattern[] = "ould"; /* pattern to search for */ 
/* find all lines matching pattern */ main() 


{ 


char line[MAXLINE]; int found = 0; 

while (getline(line, MAXLINE) > 0) 

if (strindex(line, pattern) >= 0) { printf("%s", line); 
found++; 

} 

return found; 


} 


/* getline: get line into s, return length */ int getline(char s[], int lim) 


while (*elim > 0 && (c=getchar()) != EOF && c != ^n’) s[i++] = c; 
if (c == "\n') 
sli++] = c; s[i] = '\0'; return i; 


} 


/* strindex: return index of t in s, «1 if none */ int strindex(char s[], 
char t[]) 


{ 
int i, j, k; 
for (i = 0; s[i] {= '\0'; i++) { 


for (j=i, k=O; t[k]!="\0' && s[j]==t[k]; j++, k++) 
if (k > 0 && t[k] == '\0') return i; 
return ¢1; 


函数 的 定义 形式 如 下 : 
返回 值 类 型 函数 明 ( 参 数 声 明 表 ) 


{ 

声明 和 语句 

} 

函数 定义 中 的 各 构成 部 分 都 可 以 省 略 。 最 简单 的 函数 如 下 所 示 : 
dummy() {} 





该 函数 不 执行 任何 操作 也 不 返回 任何 值 。 这 种 不 执行 任何 操作 的 函数 有 
时 很 有 用 ， 它 可 以 在 程序 开发 期 间 用 以 保留 位 置 (留待 以 后 填充 代码 )。 
如 果 函 数 定义 中 省 略 了 返回 值 类 型 ， 则 默 认为 int KH, 











程序 可 以 看 成 是 变量 定义 和 函数 定义 的 集合 。 函 数 之 间 的 通信 可 以 通过 
BB. BORE 值 以 及 外 部 变量 进行 。 函 数 在 源 文件 中 出 现 的 次 序 可 
以 是 任意 的 。 只 要 保证 每 一 个 函数 不 被 分离 到 多 个 文件 中 ， 源 程序 就 
可 以 分 成 多 个 文件 。 


被 调用 函数 通过 return 语句 同调 用 者 返回 值 ，return 语句 的 后 面 可 以 跟 
任何 表达 式 : 


return 表达 式 ; 在 必要 时 ， 表 达 式 将 被 转换 为 函数 的 返回 值 类 型 。 表 达 式 
两 边 通 党 加 一 对 圆 括号 ， 此 处 的 括 


号 是 可 选 的 。 


调用 函数 可 以 忽略 返回 值 。 并 且 ，return 语句 的 后 面 也 不 一 定 需 要 表达 
式 。 当 return 语句 的 后 面 没 有 表达 式 时 ， 函 数 将 不 同调 用 者 返回 值 。 当 
被 调用 函 数 执行 到 最 后 的 右 花 括号 而 结束 执行 时 ， 控 制 同样 也 会 返回 

给 调用 者 (不 返回 值 )。 如 果 某 个 函数 从 一 个 地 方 返 回 时 有 返回 值 ， 而 从 
为 一 个 地 方 返回 时 没有 返回 值 ， 该 函数 并 不 非法 ， 但 可 能 是 一 种 出 问题 
的 征兆 。 在 任何 情况 下 ， 如 果 函 数 没 有 成 功 地 返回 一 个 值 ， 则 它 

的 " 值 "肯定 是 无 用 的 。 


在 上 面 的 模式 查找 程序 中 ， 主 程序 main 返回 了 一 个 状态 ， 即 匹配 的 数 
目 。 该 返回 值 可 以 在 调用 该 程序 的 环境 中 使 用 。 


在 不 同 的 系统 中 ， 保 存在 多 个 源 义 件 中 的 C 语言 程序 的 编译 与 加 载 机制 
是 不 同 的 。 例 如 ， 在 UNIX 系统 中 ， 可 以 使 用 第 1 章 中 提 到 过 的 cc 命 

令 执 行 这 一 任务 。 假 定 有 3 个 函数 分 别 存 放 在 名 为 main.c、getline.c 与 
strindex.c 的 3 个 文件 中 ， 则 可 以 使 用 命令 























cc main.c getline.c strindex.c 


来 编译 这 3 个 文件 ， 并 把 生成 的 目标 代码 分 别 存 放 在 文件 main.o 
、 getline.o 与 


strindex.o 中 ， 然 后 再 把 这 3 个 文件 一 起 加 载 到 可 执行 文件 aout 中 。 如 
果 源 程序 中 存在 错误 (比如 文件 main.c 中 存在 错误 )， 则 可 以 通过 命令 





cc main.c getline.o strindex.o 


对 main.c 文件 重新 编译 ， 并 将 编译 的 结果 与 以 前 已 编译 过 的 目标 文件 
getline.o 和 strindex.o 一 起 加 载 到 可 执行 文件 中 。cc 命令 使 用 “.c" 与 “ 
.0" 这 两 种 扩展 名 来 区 分 源 文 件 与 目标 文件 。 


练习 4*1 编写 函数 strindex(s, t)， 它 返回 字符 串 t 在 s 中 最 右边 出 
现 的 位 置 。 WR s 中 不 包含 t， 则 返回 "1。 


4.2 返回 非 整 型 值 的 函数 


到 目前 为 止 ， 我 们 所 讨论 的 函数 都 是 不 返回 任何 值 (void) 或 只 返回 int 
类 型 值 的 函数 。 假如 某 个 函数 必须 返回 其 它 类 型 的 值 ， 该 怎么 办 了 昵 ? 许 
Z SUB RABUN sqrt. sin 与 cos 等 图 数 ) 返 回 的 是 double 类 型 的 值 ， 某 
些 专用 函数 则 返回 其 它 类 型 的 值 。 我 们 通过 函数 atof(s) 来 说 明 函 数 返 回 
非 整 型 值 的 方法 。 该 函数 把 字符 串 s 转换 为 相应 的 双 精 度 浮 点 数 。 atof 
函数 是 atoi 函数 的 扩展 ， 第 2 章 与 第 3 章 已 讨论 了 atoi 函数 的 几 个 版 
本 。atof K 数 需要 处 理 可 选 的 符号 和 小 数 点 ， 并 要 考虑 可 能 缺少 整数 部 
分 或 小 数 部 分 的 情况 。 我 们 这 里 编写 的 版 本 并 不 是 一 个 高 质量 的 输入 
转换 函数 ， 它 占用 了 过 多 的 空间 。 标 准 库 中 包含 类 似 功 能 的 atof K 

数 ， 在 头 文件 <stdlib.h> 中 声明 。 


首先 ， 由 于 atof 函数 的 返回 值 类 型 不 是 nt， 因此 该 函数 必须 声明 返回 
值 的 类 型 。 返 回 值 的 类 型 名 应 放 在 函数 名 字 之 前 ， 如 下 所 示 : 




















#include <ctype.h> 

/* atof: convert string s to double */ double atof(char s[]) 
{ 

double val, power; int i, sign; 


for (i = 0; isspace(s[i]); i++) /* skip white space */ 


sign = (s[i] ==“。) ?。1 : 1; 

if (s[i] == '+' || sli] == 's') i++; 

for (val = 0.0; isdigit(s[i]); i++) val = 10.0 * val + (s[i] « '0'); 

if (s[i] == ".") i++; 

for (power = 1.0; isdigit(s[i]); i++) { 

val = 10.0 * val + (s[i] ° '0'); power *= 10; 

} 

return sign * val / power; 

} 

其 次 ， 调 用 函数 必须 知道 atof 函数 返回 的 是 非 整 型 值 ， 这 一 点 也 是 很 重 


要 的 。 为 了 达到 该 目的 ， 一 种 方法 是 在 调用 函数 中 显 式 声明 atof 函 
数 。 下 面 所 示 的 基本 计算 器 程序 ( 仅 适 用 














于 文 票 短 计 算 ) 中 有 类 似 的 声明 。 该 程序 在 每 行 中 读 取 一 个 数 ( 数 的 前 面 
可 能 有 正 负 号 )， 并 对 它们 求 和 ， 在 每 次 输入 完成 后 把 这 些 数 的 累计 总 
和 打印 出 来 : 

#include <stdio.h> 

#define MAXLINE 100 

/* rudimentary calculator */ main() 

{ 

double sum, atof(char []); char line[MAXLINE]; 

int getline(char line[], int max); 

sum = 0; 

while (getline(line, MAXLINE) > 0) printf("\t%g\n", sum += atof(line)); 


return 0; 


~ 


其 中 ， 声 明 语句 
double sum, atof(char []); 


表明 sum 是 一 个 double 类 型 的 变量 ，atof MBCA char Œp 
数 ， 且 返回 一 个 double 类 型 的 值 。 


函数 atof 的 声明 与 定义 必须 一 致 。 如 果 atof 函数 与 调用 它 的 主 函数 
main 放 在 同一 源 文件 中 ， 并 且 类 型 不 一 致 ， 编 译 圳 就 会 检测 到 该 错 
误 。 但 是 ， 如 果 atof 函数 是 单独 编译 的 (这 种 可 能 性 更 大 )， 这 种 不 匹配 
的 错误 就 无 法 检测 出 来 ，atof 函数 将 返回 double 类 型 的 值 ， 而 main K 
数 却 将 返回 值 按照 int 类 型 处 理 ， 最 后 的 结果 值 党 无 音义 。 


根据 前 面 有 关 函 数 的 声明 如 何 与 定义 保持 一 致 的 讨论 ， 友 生 不 匹配 现象 





似乎 很 令 人 吃 怀 。 其 中 的 一 个 原因 是 ， 如 果 没 有 函数 原型 ， 则 函数 将 
在 第 一 次 出 现 的 表达 式 中 被 隐 式 声明 ， 例 如 : 





sum += atof(line) 


如 果 先 前 没有 声明 过 的 一 个 名 字 出 现在 某 个 表达 式 中 ， 并 且 其 后 紧 跟 一 
个 左 圆 括号 ， 那 么 上 下文 束 会 认为 该 名 字 是 一 个 函数 名 字 ， 该 函数 的 
返回 值 将 被 假定 为 int 类 型 ， 但 上 下 文 并 不 对 其 参数 作 任 何 假设 。 并 

且 ， 如 末 函 数 声明 中 不 包含 参数 ， 例 如 : 


double atof(); 


那么 编译 程序 也 不 会 对 函数 atof 的 参数 作 任 何 假设 ， 并 会 关闭 所 有 的 参 
数 检查 。 对 空 参数 表 的 这 种 特殊 处 理 是 为 了 使 新 的 编译 器 能 编译 比较 
老 的 C 语言 程序 。 不 过 ， 在 新 编写 的 程序 中 这 么 做 是 不 提倡 的 。 如 采 
图 数 珊 有 参数 ， 则 要 声明 它们 ;如 果 没 有 参数 ， 则 使 用 void 进行 声 明 。 


在 正确 进行 声明 的 函数 atof 的 基础 上 ， 我 们 可 以 利用 它 编写 出 函数 
atoi( 将 字符 串 转 换 为 int 类 型 ): 


/* atoi: convert string s to integer using atof */ int atoi(char s[]) 
{ 
double atof(char s[]); 


return (int) atof(s); 

} 

请 注意 其 中 的 声明 和 retum 语句 的 结构 。 在 下 列 形式 的 return 语句 中 : 
retum( 表 达 式 ); 


其 中 ， 表 达 式 的 值 在 返回 之 前 将 被 转换 为 函数 的 类 型 。 因 为 函数 atoi 的 
返回 值 为 int 类型， 所以，return 语句 中 的 atof 函数 的 double 类 型 值 将 
被 目 动 转换 为 int 类 型 值 。 但 是 ， 这 种 操作 可 能 会 丢失 信息 ， 茶 些 编译 
器 可 能 会 对 此 给 出 警告 信息 。 在 该 函数 中 ， 由 于 采用 了 类 型 转换 的 方 

法 显 式 表明 了 所 要 执行 的 转换 操作 ， 因 此 可 以 防止 有 关 的 警告 信息 。 


练习 4-2 对 atof 函数 进行 扩充 ， 使 它 可 以 处 理 形 如 
123.45e*6 


的 科学 表示 法 ， 其 中 ， 浮 点 数 后 面 可 能 会 紧 跟 一 个 e 或 E 以 及 一 个 指数 
(可 能 有 正 负 号 )。 


4.3 外 部 变量 


C 语言 程序 可 以 看 成 由 一 系列 的 外 部 对 象 构 成 ， 这 些 外 部 对 象 可 能 是 变 
量 或 前 数 。 形 容 词 external 与 internal 相对 的 ，internal 用 于 描述 定义 在 
函数 内 部 的 函数 参数 及 变量 。 外 部 变量 定 义 在 函数 之 外 ， 因 此 可 以 在 
许多 函数 中 使 用 。 由 于 C 语言 不 允许 在 一 个 函数 中 定义 其 它 函 数 ， 
此 函数 本 号 是 "外 部 的 "。 默 认 情 况 下 ， 外 部 变量 与 函数 具有 下 列 性 质 : 通 
过 同一 个 名 字 对 外 部 变量 的 所 有 引用 (即使 这 种 引用 来 自 于 单独 编译 的 
不 同 函 数 ) 实 际 上 都 是 引用 同一 个 对 象 (标准 中 把 这 一 性 质 称 为 外 部 链 
接 )。 在 这 个 意义 上 ， 外 部 变量 类 似 于 Fortran 语言 的 COMMON 块 或 
Pascal 语言 中 在 最 外 层 程序 块 中 声明 的 变量 。 我 们 将 在 后 面 介绍 如 何 定 
义 只 能 在 某 一 个 源 文件 中 使 用 的 外 部 变量 与 函数 。 

因为 外 部 变量 可 以 在 全 局 范围 内 访问 ， 这 就 为 函数 之 间 的 数据 交换 提供 
了 一 种 可 以 代 蔡 函数 参数 与 返回 值 的 方式 。 任 何 函 数 都 可 以 通过 名 字 
访问 一 个 外 部 变量 ， 当 然 这 个 名 字 需 要 通过 某 种 方式 进行 声明 。 












































如 果 函 数 之 间 需 要 其 部 大 量 的 变量 ， 使 用 外 部 变量 要 比 使 用 一 个 很 长 的 
参数 表 更 方便 、 有 效 。 但 是 ， 我 们 在 第 1 章 中 已 经 指出 ， 这 样 做 必须 
非常 谨 居 ， 因 为 这 种 方式 可 能 对 程序 结 构 产 生 不 民 的 影响 ， 而 且 可 能 
会 导致 程序 中 各 个 函数 之 间 具 有 太 多 的 数据 联系 。 


外 部 变量 的 用 途 还 表现 在 它们 与 内 部 变量 相 比 具有 更 大 的 作用 域 和 更 长 
的 生存 期 。 目 动 变量 只 能 在 函数 内 部 使 用 ， 从 其 所 在 的 函数 被 调用 时 
变量 开始 存在 ， 在 函数 退出 时 变量 也 将 消失 。 而 外 部 变量 是 永久 存在 
的 ， 它 们 的 值 在 一 次 函数 调用 到 下 一 次 函数 调用 之 间 你 持 不 变 。 因 
此 ， 如 琳 两 个 函数 必须 共 诗 某 些 数据 ， 而 这 两 个 函数 互 不 调用 对 方 ， 这 
种 情况 下 最 方便 的 方式 便 是 把 这 些 共享 数据 定义 为 外 部 变量 ， 而 不 是 
作为 函数 参数 传递 。 


下 面 我 们 通过 一 个 更 复杂 的 例子 来 说 明 这 一 点 。 我 们 的 目标 是 编写 一 个 
具有 加 (+)、 减 (-)、 乘 (*)、 除 (/) 四 则 运算 功能 的 计算 器 程序 。 为 了 更 容 
易 实 现 ， 我 们 在 计算 器 中 使 用 逆 波 兰 表 示 法 代 蔡 普通 的 中 轰 表 示 法 ( 逆 
波兰 表示 法 用 在 某 些 袖珍 计算 器 中 ，Forth 与 Postscript 等 语言 也 使 用 了 
逆 波 兰 表 示 法 )。 


在 逆 波兰 表示 法 中 ， 所 有 运算 符 部 跟 在 操作 数 的 后 面 。 比 如 ， 下 列 中 组 


式 : 




















(1-2) *(4+5) 

采用 逆 波 兰 表 示 法 表示 为 : 

12*45+* 

RERA PN ie BFS, JR BETTE BE FT m BE LER TE BO 
不 会 引起 歧义 。 计算 器 程序 的 实现 很 简单 。 每 个 操作 数 都 被 依次 压 入 
到 校 中 ; 当 一 个 运算 符 到 达 时 ， 从 


校 中 弹出 相应 数目 的 操作 数 (对 二 元 运算 符 来 说 是 两 个 操作 数 )， 把 该 运 
算 符 作用 于 弹出 的 操 


作 数 ， 并 把 运算 结果 再 压 入 到 校 中 。 例 如 ， 对 上 面 的 逆 波兰 表达 式 来 

说 ， 首 先 把 1 和 2 压 入 

到 校 中 ， 再 用 两 者 之 差 1 取代 它们 ;然后 ， 将 4 和 5 压 入 到 校 中 ， 再 用 

两 者 之 和 9 取代 它们 。 最 后 ， 从 校 中 取出 校 顶 的 .1 和 9， 并 把 它们 的 积 
“9 压 入 到 校 顶 。 到 达 输 入 行 的 末尾 时 ， 把 校 顶 的 值 弹 出 并 打印 。 


这 样 ， 该 程序 的 结构 就 构成 一 个 循环 ， 每 次 循环 对 一 个 运算 符 及 相应 的 
操作 数 执行 一 次 操作 : 


while (下 一 个 运算 符 或 操作 数 不 是 文件 结束 指示 符 ) 直 (是 数 ) 
将 该 数 压 入 到 找 中 








else if (是 运算 符 ) 

弹出 所 需 数 目的 操作 数 
执行 运算 

将 结果 压 入 到 找 中 


else if (是 换行 符 ) 


弹出 并 打印 找 项 的 值 


else 
出 错 


校 的 压 入 与 弹出 操作 比较 简单 ， 但 是 ， 如 果 把 错误 检测 与 恢复 操作 都 加 
进来 ， 该 程序 束 显得 很 长 了 ， 最 好 把 它们 设计 成 独立 的 函数 ， 而 不 要 
把 它们 作为 程序 中 重复 的 代码 段 使 用 。 另外 还 需要 一 个 单独 的 函数 来 
取 下 一 个 输入 运算 符 或 操作 数 。 


到 目前 为 止 ， 我 们 还 没有 讨论 设计 中 的 一 个 重要 问题 :把 校 放 在 哪儿 ?也 
就 是 说 ， 哪 些 例 程 可 以 直接 访问 它 ?一 种 可 能 是 把 它 放 在 主 函 数 main 
中 ， 把 校 及 其 当前 位 置 作为 参数 传递 给 对 它 执 行 压 入 或 弹出 操作 的 函 
数 。 但 是 ，main 函数 不 需要 了 解 控制 校 的 变量 信息 ， 它 只 进行 压 入 与 
弹出 操作 。 因 此 ， 可 以 把 校 及 相关 信息 放 在 外 部 变量 中 ， 并 只 供 push 
与 pop 函数 访问 ， 而 不 能 被 main 函数 访问 。 


把 上 面 这 段 话 转换 成 代码 很 容易 。 如 果 把 该 程序 放 在 一 个 源 文 件 中 ， 程 
序 可 能 类 似 于 下 列 形式 : 




















#include... fe — EE SL CE */ 
#define... /* 一些 define 定义 */ 
main 使 用 的 函数 声明 

main() {... } 


push 与 pop 所 使 用 的 外 部 变量 
void push( double f) { ... } 
double pop(void) { ... } 


int getop(char s[]) { ... } 


被 getop 调用 的 函数 
我 们 在 后 面部 分 将 讨论 如 何 把 该 程序 分 割 成 两 个 或 多 个 源 文 件 。 
main 函数 包括 一 个 很 大 的 switch 循环 ， 访 循环 根据 运算 符 或 操作 数 的 


类 型 控制 程序 的 转移 。 这 里 的 switch 语句 的 用 法 比 3.4 节 中 的 例子 更 为 
典型 。 





#include <stdio.h> 


#include <stdlib.h> /* for atof() */ 
#define MAXOP 100 /* max size of operand or operator */ 
#define NUMBER ‘0’ /* signal that a number was found */ 


int getop(char []); void push(double); double pop(void); 
/* reverse Polish calculator */ main() 

{ 

int type; double op2; char ss;MAXOP]; 

while ((type = getop(s)) != EOF) { switch (type) { 
case NUMBER: push(atof(s)); break; 

case '+': 

push(pop() + pop()); break; 

case '*"; 

push(pop() * pop()); break; 

case '*': 


op2 = pop(); push(pop() * op2); break; 


case /": 

op2 = pop(); 

if (op2 != 0.0) 

push(pop() / op2); else 

printf("error: zero divisor\n"); break; 
case \D : 

printf("\t%.8g\n", pop()); break; 
default: 

printf("error: unknown command %s\n", s); break; 
} 

} 

return 0; 

} 


因为 + 与 * 两 个 运算 符 满足 交换 律 ， 因 此 ， 操 作 数 的 弹出 次 序 无 关 紧 要 。 
Eb cor “与 /两 个 


运算 符 的 左右 操作 数 必须 加 以 区 分 。 在 函数 调用 
push(pop() * pop()); /* WRONG */ 


中 并 没有 定义 两 个 pop 调用 的 求 值 次 序 。 为 了 保证 正确 的 次 序 ， 必 须 像 
main 函数 中 一 样 把 第 一 个 值 弹出 到 一 个 临时 变量 中 。 ; 


#define MAXVAL 100 /* maximum depth of val stack */ 


int sp = 0; /* next free stack position */ double 
val[MAXVAL]; /* value stack */ 


/* push: push f onto value stack */ void push(double f) 

{ 

if (sp < MAXVAL) val[sp++] = f; 

else 

printf("error: stack full, can't push %g\n", f); 

} 

/* pop: pop and return top value from stack */ double pop(void) 
{ 

if (sp > 0) 

return val[eesp]; else { 

printf("error: stack empty\n"); return 0.0; 

} 

} 

如 果 变 量 定 义 在 任何 函数 的 外 部 ， 则 是 外 部 变量 。 因 此 ， 我 们 把 push 








和 pop 函数 必须 共享 的 校 和 校 顶 指针 定义 在 这 两 个 函数 的 外 部 。 但 
是 ，main 函数 本 里 并 没有 引用 校 或 校 项 指针， 因此， 对 main 函数 而 言 
要 将 它们 隐藏 起 来 。 


下 面 我 们 来 看 getop 函数 的 实现 。 该 函数 获取 下 一 个 运算 符 或 操作 数 。 
该 任务 实现 起 来 比较 容易 。 它 需要 跳 过 空格 与 制 表 符 。 如 果 下 一 个 字 
符 不 是 数字 或 小 数 氮 ， 则 返回 ;否则 ， 把 这 些 数字 字符 串 收 集 起 来 (其 中 
可 能 包含 小 数 点 )， 并 返回 NUMBER， 以 标识 数 已 经 收集 起 来 了 。 








#include <ctype.h> 


int getch(void); void ungetch(int); 


/* getop: get next character or numeric operand */ int getop(char s[]) 
{ 

int i, C; 

while ((s[0] = c = getch()) == '' || c == '\t) 

s[1] = \0'; 


if (lisdigit(c) && c != 


return C; /* not a number */ i = 0; 


if (isdigit(c)) /* collect integer part */ while (isdigit(s[++i] = c = 
getch())) 


if (c ==" /* collect fraction part */ while (isdigit(s[++i] = c = 


getch())) 


s[i] = '\0'; if (c != EOF) 
ungetch(c); return NUMBER; 
} 


这 段 程序 中 的 getch 与 ungetch AA eR BUA TT HRE ORE re Pe A 2 h 
现 这 样 的 情 况 :程序 不 能 确定 它 已 经 读 入 的 输入 是 否 足 够 ， 除 非 超前 多 
读 入 一 些 输 入 。 读 入 一 些 字符 以 合成 一 个 数字 的 情况 便 是 一 例 :在 看 到 
第 一 个 非 数 字 字 符 之 前 ， 已 经 读 入 的 数 的 完整 性 是 不 能 确定 的 。 由 于 
ee aa 这 样 融 导致 最 后 有 一 个 字符 不 属于 当前 所 要 
读 入 的 数 。 


如 果 能 " 反 读 "不 需要 的 字符 ， 该 问题 就 可 以 得 到 解决 。 每 当 程序 多 读 入 
一 个 字符 时 ， 就 把 它 压 回 到 输入 中 ， 对 代码 其 余部 分 而 言 就 好 像 没有 
读 入 该 字符 一 样 。 我 们 可 以 编写 一 对 互相 协作 的 函数 来 比较 方便 地 模 
拟 反 取 字符 操作 。getch 函数 用 于 读 入 下 一 个 待 处 理 的 字符 ， 而 ungetch 
函数 则 用 于 把 字符 放 回 到 输入 中 ， 这 样 ， 此 后 在 调用 getch 函数 时 ， 在 
读 入 新 的 输入 之 前 先 返回 ungetch 函数 放 回 的 那个 字符 。 


这 两 个 函数 之 间 的 协同 工作 也 很 简单 。ungetch 函数 把 要 压 回 的 字符 放 
到 一 个 共 至 缓冲 区 (字符 数组 ) 中 ， 当 该 缓冲 区 不 空 时 ，getch 函数 就 从 
绥 冲 区 中 读 取 字 符 ; 当 缓冲 区 为 空 时 ，getch 函数 调用 getchar 函数 直接 
从 输入 中 读 字符 。 这 里 还 需要 增加 一 个 下 标 变 量 来 记 住 缓冲 区 中 当前 
字符 的 位 置 。 


由 于 绥 冲 区 与 下 标 变 量 是 供 getch 与 ungetch 函数 共享 的 ， 且 在 两 次 调 
用 之 间 必 须 保 持 值 不 变 ， 因 此 它们 必须 是 这 两 个 函数 的 外 部 变量 。 可 














以 按照 下 列 方式 编写 getch、ungetch 函数 及 其 共享 变量 : 


#define BUFSIZE 100 


char buf[BUFSIZE]; /* buffer for ungetch */ 

int bufp = 0; /* next free position in buf */ 

int getch(void) /* get a (possibly pushedeback) character */ 
{ 


return (bufp > 0) ? buf[**bufp] : getchar(); 

} 

void ungetch(int c) /* push character back on input */ 

{ 

if (bufp >= BUFSIZE) 

printf("ungetch: too many characters\n"); else 

buf[bufp++] = c; 

} 

标准 库 中 提供 了 ungetc， 它 将 一 个 字符 压 回 到 校 中 ， 我 们 将 在 第 7 章 中 


讨论 该 函数 。 为 了 提供 一 种 更 通用 的 方法 ， 我 们 在 这 里 使 用 了 一 个 数 
组 而 不 是 一 个 字符 。 





BR] 403 在 有 了 基本 框 、 后 ， 对 计算 霹 程 序 进行 扩充 就 比较 简单 了 。 在 
该 程序 中 加 入 取 模 (9%0) 运 算 符 ， 并 注意 考虑 负数 的 情况 。 


练习 494 在 校 操作 中 添加 几 个 命令 ， 分 别 用 于 在 不 弹出 元 素 的 情况 下 打 
复制 校 项 元 素 ; 交 换 校 项 两 个 元 素 的 值 。 为 外 增加 一 个 命令 
于 清空 校 。 


练习 4.5 给 计算 器 程序 增加 访问 sin. exp 与 pow 等 库 函 数 的 操作 。 有 关 
这 些 库 函 数 的 详细 人 信息， 参见 附录 B.4 节 中 的 头 文 件 <math.h> 。 


练习 4"6 给 计算 器 程序 增加 处 理 变 量 的 命令 (提供 26 个 具有 单个 英文 字 
母 变 量 名 的 变量 很 容易 )。 增 加 一 个 变量 存放 最 近 打 印 的 值 。 


练习 4。7 编写 一 个 函数 ungets(S)， 将 整个 字符 串 s 压 回 到 输入 中 。 
ungets 函数 需要 使 用 buf 和 bufp 吗 ? 它 能 否 仅 使 用 ungetch 函数 ? 








练习 4。8 假定 最 多 只 压 回 一 个 字符 。 请 相应 地 修改 getch 与 
ungetch 这 两 个 函数 。 练习 4*9 以 上 介绍 的 getch 与 ungetch 函数 


不 能 正确 地 处 理 压 回 的 EOF。 考 虑 压 回 
EOF 时 应 该 如 何 处 理 ?请 实现 你 的 设计 方案 。 


练习 4°10 另 一 种 方法 是 通过 getline 函数 读 入 整个 输入 行 ， 这 种 
情况 下 可 以 不 使 用 


getch 与 ungetch 函数 。 请 运用 这 一 方法 修改 计算 器 程序 。 
4.4 作用 域 规则 
构成 C 语言 程序 的 函数 与 外 部 变量 可 以 分 开 进 行 编译 。 一 个 程序 可 以 存 
放 在 几 个 文件 中 ， 原先 已 编译 过 的 函数 可 以 从 库 中 进行 加 载 。 这 里 我 
们 感 兴 趣 的 问题 有 : 

如 何 进行 声明 才能 确保 变量 在 编译 时 被 正确 声明 ? 

如 何 安排 声明 的 位 置 才 能 确保 程序 在 加 载 时 各 部 分 能 正确 连 











如 何 组 织 程序 中 的 声明 才能 确保 只 有 一 份 副本 ? 
如 何 初始 化 外 部 变量 ? 


为 了 讨论 这 些 问 题 ， 我 们 重新 组 织 前 面 的 计算 融 程 序 ， 将 它 分 散 到 多 个 
文件 中 。 从 实践 的 角 度 来 看 ， 计 算 圳 程序 比较 小 ， 不 值得 分 成 几 个 文 
件 存 放 ， 但 通过 它 可 以 很 好 地 说 明 较 大 的 程序 中 过 到 的 类 似 问 题 。 


名 字 的 作用 域 指 的 是 程序 中 可 以 使 用 该 名 字 的 部 分 。 对 于 在 函数 开头 声 
明 的 上 自动 变量 来 说 ， 其 作用 域 是 声明 该 变量 名 的 函数 。 不 同 函 数 中 声 
明 的 具有 相同 名 字 的 各 个 局 部 变量 之 间 没有 任何 关系 。 函 数 的 参数 也 
是 这 样 的 ， 实 际 上 可 以 将 它 看 作 是 局 部 变量 。 

外 部 变量 或 函数 的 作用 域 从 声明 它 的 地 方 开始 ， 到 其 所 在 的 ( 待 编译 的 ) 
文件 的 末尾 结束 。 例 如 ， 如 果 main, sp. val. push 与 pop 是 依次 定义 
在 某 个 文件 中 的 5 个 函数 或 外 部 变量 ， 如 下 所 示 : 


main() { ...} 























int sp = 0; 
double vall[MAXVAL]; 


void push(double f) { ... } 


double pop(void) { ... } 


那么 ， 在 push 与 pop 这 两 个 函数 中 不 需 进 行 任何 声明 就 可 以 通过 名 字 
访问 变量 sp val, 但 是 ， 这 两 个 变量 名 不 能 用 在 main 函数 中 ，push 
与 pop 函数 也 不 能 用 在 main 函数 中 。 


另 一 方面 ， 如 果 要 在 外 部 变量 的 定义 之 前 使 用 该 变量 ， 或 者 外 部 变量 的 
定义 与 变量 的 使 用 不 在 同一 个 源 文件 中 ， 则 必须 在 相应 的 变量 声明 中 
强制 性 地 使 用 关键 字 extern 。 


将 外 部 变量 的 声明 与 定义 严格 区 分 开 来 很 重要 。 变 量 声明 用 于 说 明 变 量 
的 属性 (主要 是 变量 的 类 型 )， 而 变量 定义 除 此 以 外 还 将 引起 存储 器 的 分 
Ac. WARR PS a ACE TA K 外 部 : 














int sp; 
double vall[MAXVAL]; 


那么 这 两 条 语句 将 定义 外 部 变量 sp 与 val， 并 为 之 分 配 存 储 单元 ， 同 时 
这 两 条 语句 还 可 以 作 为 该 源 文件 中 其 余部 分 的 声明 。 而 下 面 的 两 行 语 


fJ: 








extern int sp; extern double vall]; 


为 源 文件 的 其 余部 分 声明 了 一 个 int 类 型 的 外 部 变量 sp 以 及 一 个 double 
数组 类 型 的 外 部 变量 val( 该 数组 的 长 度 在 其 它 地 方 确定 )， 但 这 两 个 声 
明 并 没有 建立 变量 或 为 它们 分 配 存储 单元 。 


在 一 个 源 程序 的 所 有 源 文件 中 ， 一 个 外 部 变量 只 能 在 茶 个 文件 中 定义 一 
次 ， 而 其 它 文件 可 以 通过 extern 声明 来 访问 它 ( 定 义 外 部 变量 的 源 文 件 
中 也 可 以 包含 对 该 外 部 变量 的 extern 声明 )。 外 部 变量 的 定义 中 必须 指 
定数 组 的 长 度 ， 但 extern 声明 则 不 一 定 要 指定 数 组 的 长 度 。 


外 部 变量 的 初始 化 只 能 出 现在 其 定义 中 。 
假定 函数 push 与 pop 定义 在 一 个 文件 中 ， 而 变量 val 与 sp 在 另 一 个 文 


件 中 定义 并 被 初始 化 (通常 不 大 可 能 这 样 组 织 程序 )， 则 需要 通过 下 面 这 
些 定义 与 声明 把 这 些 函 数 和 变量 " 绑 定 "在 一 起 : 




















在 文件 filel 中 : 

extern int sp; extern double val[]; 

void push(double f) { ... } 

double pop(void) { ... } 

在 文件 file2 中 : 

int sp = 0; 

double val[MAXVAL]; 

由 于 文件 filet 中 的 extern 声明 不 仅 放 在 函数 定义 的 外 面 ， 而 且 还 放 在 
它们 的 前 面 ， 因 此 它 们 适用 于 该 文件 中 的 所 有 函数 。 对 于 fle1， 这 样 


一 组 声明 就 够 了 。 如 果 要 在 同一 个 文件 中 先 使 用 、 后 定义 变量 sp 与 
val， 也 需要 按照 这 种 方式 来 组 织 文件 。 








下 面 我 们 来 考虑 把 上 述 的 计算 器 程序 分 割 到 若干 个 源 文 件 中 的 情况 。 如 
果 该 程序 的 各 组 成 部 分 很 长 ， 这 么 做 还 是 有 必要 的 。 我 们 这 样 分 割 :将 
主 函数 main 单独 放 在 文件 main.c 中 ;将 push 与 pop 函数 以 及 它们 使 用 
的 外 部 变量 放 在 第 二 个 文件 stack.c 中 ;将 getop 函数 放 在 第 三 个 文件 
getop.c 中 ;将 getch 与 ungetch 函数 放 在 第 四 个 文件 getch.c 中 。 之 所 以 
eee ee 主要 是 考虑 在 实际 的 程序 中 ， 它 们 分 别 来 自 于 单独 编 
译 的 库 。 


此 外 ， 还 必须 考虑 定义 和 声明 在 这 些 文 件 之 间 的 共享 问题 。 我 们 尽 可 能 
把 共享 的 部 分 集 中 在 一 起 ， 这 样 就 只 需要 一 个 副本 ， 改 进程 序 时 也 容 
易 保 证 程序 的 正确 性 。 我 们 把 这 些 公共 部 分 放 在 头 文件 calc.h 中 ， 在 需 
要 使 用 该 头 文 件 时 通过 #include 指令 将 它 包 含 进 来 (#include 指令 将 在 
4.11 节 中 介绍 )。 这 样 分 割 后 ， 程 序 的 形式 如 下 所 示 : 

















calc.h 





#define HUMBER ’0’ 
void push(double) ; 
double pop(void); 
int getop(char []); 
int getch(void); 
void ungetch(int); 





main.c getop.c stack.c 


#include <stdio.h> 





#include <stdio.h> | | #include <stdio.h> 








#include <stdlib.h> #include <ctype.h> #include "calc.h" 
#include "calc.h" #include “calc.h" #define MAXVAL 100 
#define MAXOP 100 getop() { int sp = 0; 
main() { Si double val [MAZVAL] ; 
} void push(double) { 
} we 
double pop(void) { 
getch.c ima 
#include <stdio.h> } 


#define BUFSIZE 100 
char buf [BUFSIZE] ; 
int bufp = 0; 

int getch(void) { 


} 
void ungetch(int) { 





} 





RIX FP ETS BE: TT FT OE Reih i 
它 完 成 任务 所 需 的 信息 ; 另 一 方面 是 现实 中 维护 较 多 的 头 文件 比较 困 
难 。 我 们 可 以 得 出 这 样 一 个 结论 :对 于 某 些 中 等 规模 的 程序 ， 最 好 只 用 
一 个 头 文 件 存放 程序 中 各 部 分 共享 的 对 象 。 较 大 的 程序 需要 使 用 更 多 
的 头 文 件 ， 我 们 需要 精心 地 组 织 它们 。 








某 些 变量 ， 比 如 文件 stack.c 中 定义 的 变量 sp 与 val 以 及 文件 getch.c 中 
定义 的 变量 buf 与 bufp， 它 们 仅 供 其 所 在 的 源 文 件 中 的 函数 使 用 ， 其 它 
函数 不 能 访问 。 用 static 声明 限定 外 部 变量 与 函数 ， 可 以 将 其 后 声明 的 
对 象 的 作用 域 限 定 为 被 编译 源 文件 的 剩余 部 分 。 通过 static 限定 外 部 对 
象 ， 可 以 达到 隐藏 外 部 对 象 的 目的 ， 比 如 ，getch*ungetch 复合 结构 需要 
共享 buf 与 bufp 两 个 变量 ， 这 样 buf 与 bufp 必须 是 外 部 变量 ， 但 这 两 
个 对 象 不 应 该 被 getch 与 ungetch 函数 的 调用 者 所 访问 。 

要 将 对 象 指定 为 静态 存储 ， 可 以 在 正常 的 对 象 声 明 之 前 加 上 关键 字 
static 作为 前 级 。 如 果 把 上 述 两 个 函数 和 两 个 变量 放 在 一 个 文件 中 编 
译 ， 如 下 所 示 : 


static char buf[ BUFSIZE]; /* buffer for ungetch */ static int bufp = 
0; /* next free position in buf */ 




















int getch(void) { ... } 
void ungetch(int c) { ... } 


那么 其 它 函 数 就 不 能 访问 变量 buf 与 bufp， 因 此 这 两 个 名 字 不 会 和 同一 

程序 中 的 其 它 文件 中 的 相同 的 名 字 相 冲突 。 同 样 ， 可 以 通过 把 变量 sp 

声明 为 静态 类 型 隐藏 这 两 个 由 执行 校 操作 的 push 与 pop 函数 使 
JAE o 


外 部 的 static FEE eae, SPA, CHTS. WY 
情况 下 ， 函 数 名 字 是 全 局 可 访问 的 ， 对 整个 程序 的 各 个 部 分 而 言 都 可 
见 。 但 是 ， 如 果 把 函数 声明 为 static 类 型 ， 则 该 函数 名 除了 对 该 函数 声 
明 所 在 的 文件 可 见 外 ， 其 它 文 件 都 无 法 访问 。 


static 也 可 用 于 声明 内 部 变量 。static 类 型 的 内 部 变量 同 自动 变量 一 样 ， 
是 某 个 特定 函数 的 局 部 变量 ， 只 能 在 该 函数 中 使 用 ， 但 它 与 自动 变量 
不 同 的 是 ， 不 管 其 所 在 函数 是 否 被 调用 ， 它 一 直 存 在 ， 而 不 像 上 自动 变 
量 那 样 ， 随 着 所 在 函数 的 被 调用 和 退出 而 存在 和 消失 。 换 句 话说 ， 
static 类 型 的 内 部 变量 是 一 种 只 能 在 茶 个 特定 函数 中 使 用 但 一 直 占 据 存 
储 空间 的 变量 。 


练习 4°11 修改 getop 函数 ， 使 其 不 必 使 用 ungetch 函数 。 提 示 : 可 























以 使 用 一 个 

static 类 型 的 内 部 变量 解决 该 问题 。 

4.7 AFRE 

register 声明 告诉 编译 器 ， 它 所 声明 的 变量 在 程序 中 使 用 频率 较 高 。 其 
思想 是 ， 将 register 变量 放 在 机 器 的 寄存 器 中 ， 这 样 可 以 使 程序 更 小 、 
执行 速度 更 快 。 但 编译 器 可 以 忽略 此 选 页 。 


register 声明 的 形式 如 下 所 示 : 








register int x; register char c; 


register 声明 只 适用 于 自动 变量 以 及 函数 的 形式 参数 。 下 面 是 后 一 种 情 
况 的 例子 : 


f(register unsigned m, register long n) 


{ 


register int 1; 


} 
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制 。 每 个 函数 中 只 有 很 少 的 变量 可 以 保存 在 寄存 器 中 ， 且 只 人 允许 东 些 
类 型 的 变量 。 但 是 ， 过 量 的 寄存 器 声明 并 没有 什么 害处 ， 这 是 因为 编 
译 器 可 以 忽略 过 量 的 或 不 文 持 的 寄存 器 变量 声明 。 为 外 ， 无 论 寄存 器 
变量 实际 上 是 不 是 存放 在 寄存 右 中 ， 它 的 地 址 都 是 不 能 访问 的 (有 关 这 
一 点 更 详细 的 信息 ， 我 们 将 在 第 5 章 中 讨论 )。 在 不 同 的 机 费 中 ， 对 寄 
存 器 变量 的 数目 和 类 型 的 具体 限制 也 是 不 同 的 。 


4.8 程序 块 结构 


C 语言 并 不 是 Pascal 等 语言 意义 上 的 程序 块 结构 的 语言 ， 它 不 允许 在 函 
数 中 定义 函数 。 但 是 ， 在 函数 中 可 以 以 程序 块 结构 的 形式 定义 变量 。 
变量 的 声明 (包括 初始 化 ) 除 了 可 以 紧 跟 在 函数 开始 的 花 括 号 之 后 ， 还 可 
以 紧 跟 在 任何 其 它 标识 复合 语句 开始 的 左 花 括号 之 后 。 以 这 种 方式 声 
明 的 变量 可 以 隐藏 程序 块 外 与 之 同名 的 变量 ， 它 们 之 间 没 有 任何 关系 ， 
a E 
mE Fy ESP: 


if (n> 0) { 












































int i; /* declare a new i */ 


for (i = 0; i < n; i++) 


} 
变量 i 的 作用 域 是 证 语句 的 " 真 "分 文 ， 这 个 站 SATE Rh H i 无 





关 。 每 次 进入 程 序 块 时 ， 在 程序 块 内 声明 以 及 初始 化 的 自动 变量 都 将 
被 初始 化 。 静 态 变量 只 在 第 一 次 进入 程序 块 时 被 初始 化 一 次 。 


Re aaa a a 函数 。 在 下 面 的 
明 





int x; int y; 
f(double x) 
{ 

double y; 

} 


Pai 3 f 内 的 变量 x 引用 的 是 函数 的 参数 ， 类 型 为 double; 面 在 函数 f 外 ， 
x 是 int 类 型 的 外 部 变量 。 这 段 代 人 码 中 的 变量 y 也 是 如 此 。 


在 一 个 好 的 程序 设计 风格 中 ， 应 该 避免 出 现 变 量 名 隐藏 外 部 作用 域 中 相 
同名 字 的 情况 ， 人 耕 则 ， 很 可 能 引起 混乱 和 错误 。 


4.9 人 初始 化 


前 面 我 们 多 次 提 到 过 初始 化 的 概念 ， 不 过 始终 没有 详细 讨论 。 本 市 将 对 
前 面 讨论 的 各 种 








存储 类 的 初始 化 规则 做 一 个 总 结 。 

在 不 进行 显 式 初始 化 的 情况 下 ， 外 部 变量 和 静态 变量 都 将 被 初始 化 为 
O TAU V0 SC EEA a 存 吕 变量 的 外 全 则 没有 定义 (外 初 信 为 无 用 的 信 
FA). 


oe 可 以 在 变量 名 后 紧 跟 一 个 等 号 和 一 个 表达 式 来 初始 化 
z >EE! 














int x = 1; 
char squota = '\"; 
long day = 1000L * 60L * 60L * 24L; /* milliseconds/day */ 


对 于 外 部 变量 与 静态 变量 来 说 ， 初 始 化 表达 式 必 须 是 第 量 表达 式 ， 且 只 
初始 化 一 次 (从 概念 上 讲 是 在 程序 开始 执行 前 进行 初始 化 )。 对 于 自动 变 
量 与 寄存 器 变量 ， 则 在 每 次 进入 函数 或 程 序 块 时 都 将 被 初始 化 。 


对 于 目 动 变量 与 寄存 器 变量 来 阅 ， 初 始 化 表达 式 可 以 不 是 常量 表达 式 : 
表达 式 中 可 以 包 合 任 意 在 此 表达 式 之 前 已 经 定义 的 值 ， 包 括 函 数 调 
用 ， 我 们 在 3.3 市 中 介绍 的 折 半 查找 程序 的 初始 化 可 以 采用 下 列 形式 : 





























int binsearch(int x, int v[], int n) 
{ 
int low = 0; 


int high = n ° 1; int mid; 


} 
代 答 原来 的 形式 : 


int low, high, mid; 


low = 0; 
high = ne 1; 


实际 上 ， 自 动 变量 的 初始 化 等 效 于 简写 的 赋值 语句 。 究 竟 采 用 哪 一 种 形 
式 ， 还 得 看 个 人 的 习 惯 。 考 虑 到 变量 声明 中 的 初始 化 表达 式 容易 被 人 
忽略 ， 且 距 使 用 的 位 置 较 远 ， 我 们 一 般 使 用 显 式 的 赋值 语句 。 


数组 的 初始 化 可 以 在 声明 的 后 面 紧 跟 一 个 初始 化 表达 式 列表 ， 初 始 化 表 
达 式 列表 用 人 花 括 号 括 起 来 ， 各 初始 化 表达 式 之 间 通 过 运 号 分 隔 。 例 
如 ， 如 果 要 用 一 年 中 各 月 的 天 数 初 始 化 数组 days， 其 变量 的 定义 如 下 : 


int days[] = {31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}; 


当 省 略 数组 的 长 度 时 ， 编 译 器 将 把 花 括 号 中 初始 化 表达 式 的 个 数 作 为 数 
组 的 长 度 ， 在 本 例 中 数组 的 长 度 为 12。 


如 果 初 始 化 表达 陈 的 个 数 比 数组 元 索 数 少 ， 则 对 外 部 变量 、 静 态 变 量 和 
目 动 变 量 来 说 ， 没有 初始 化 表达 式 的 元 素 将 被 初始 化 为 0， 如 宁 初 始 化 
表达 式 的 个 数 比 数组 元 素数 多 ， 则 是 错 误 的 。 不 能 一 次 将 一 个 初始 化 
表达 式 指 定 给 多 个 数组 元 素 ， 也 不 能 跳 过 前 面 的 数组 元 系 而 直 接 初 始 
化 后 面 的 数组 元 系 。 


字符 数组 的 初始 化 比较 特殊 :可 以 用 一 个 字符 串 来 代 蔡 用 花 括 号 括 起 来 
并 用 逗号 分 隔 的 初始 化 表达 式 序 列 。 例 如 : 








char pattern[] = "ould "; 

它 同 下 面 的 声明 是 等 价 的 : 

这 种 情况 下 ， 数 组 的 长 度 是 5(4 个 字符 加 上 一 个 字符 串 结束 符 \0')。 
4.10 递归 

C 语言 中 的 函数 可 以 递归 调用 ， 即 函数 可 以 直接 或 间接 调用 上 自 喘 。 我 们 


考虑 一 下 将 一 个 数 作为 字符 串 打印 的 情况 。 前 面 讲 过 ， 数 字 是 以 反 订 
T PETT 000, 
Ho 








解决 该 问题 有 两 种 方法 。 一 种 方法 是 将 生成 的 各 个 数字 依次 存储 到 一 个 
数组 中 ， 然 后 再 以 相反 的 次 序 打 印 它们 ， 这 种 方式 与 3.6 节 中 itoa 函数 
的 处 理 方 式 相 似 。 丈 一 种 方法 则 是 使 用 递归 ， 函 数 printd 首先 调用 它 目 
号 打 印 前 面 的 (高 位 ) 数 字 ， 然 后 再 打印 后 面 的 数字 。 这 里 编写 的 函数 不 
能 处 理 最 大 的 负数 。 

#include <stdio.h> 

/* printd: print n in decimal */ void printd(int n) 

{ 

if (n < 0) { putchar(''); n = en; 

} 

if (n / 10) 

printd(n / 10); 

putchar(n % 10 + '0'); 


} 





函数 递归 调用 上 自身 时 ， 每 次 调用 都 会 得 到 一 个 与 以 前 的 目 动 变量 集合 不 
同 的 新 的 目 动 变 量 集合 。 因 此 ， 调 用 printd(123) 时 ， 第 一 次 调用 printd 
的 参数 n=123。 它 把 12 传递 给 printd 的 第 二 次 调用 ， 后 者 又 把 1 传递 
结 printd 的 第 三 次 调用 。 第 三 次 调用 printd 时 首先 将 打印 1， 然 后 再 返 
回 到 第 二 次 调用 。 从 第 三 次 调用 返回 后 的 第 二 次 调用 同样 也 将 先 打印 
2， 然 后 再 返回 到 第 一 次 调用 。 返 回 到 第 一 次 调用 时 将 打 3， 随 之 结束 
函数 的 执行 。 


另外 一 个 能 较 好 说 明 递 归 的 例子 是 快速 排序 。 人 快速 排序 算法 是 C. A. R. 
Hoare 于 1962 年 发 明 的 。 对 于 一 个 给 定 的 数组 ， 从 中 选择 一 个 元 素 ， 

以 该 元 素 为 界 将 其 余 元 素 划 分 为 两 个 子 集 ， 一 个 子 集中 的 所 有 元 素 都 
小 于 该 元 索 ， 另 一 个 子 集中 的 所 有 元 素 都 大 于 或 等 于 该 元 素 。 对 这 样 
两 个 子 集 递归 执行 这 一 过 程 ， 当 某 个 子 集中 的 元 素数 小 于 2 时 ， 这 个 子 
集 就 不 需要 再 次 排序 ， 终 止 递归 。 

从 执行 速度 来 讲 ， 下 列 版 本 的 快速 排序 函数 可 能 不 是 最 快 的 ， 但 它 是 最 
De ee ere ee eee ne rea 

[A] TCR 


/* qsort: sort v[left]...v[right] into increasing order */ void qsort(int 
v[], int left, int right) 




















{ 
int i, last; 


void swap(int v[], int i, int j); 


if (left >= right) /* do nothing if array contains */ return; /* fewer 
than two elements */ 


swap(v, left, (left + right)/2); /* move partition elem */ last = left; hs 
to v[0] */ 
for (i = left + 1; i <= right; i++) /* partition */ if (vLi] < v[left]) 


swap(v, ++last, i); 


swap(V, left, last); /* restore partition elem */ qsort(v, left, 
laste1); 


qsort(v, last+1, right); 
} 


这 里 之 所 以 将 数组 元 素 交 换 操 作 放 在 一 个 单独 的 函数 swap 中 ， 是 因为 
‘EE qsort 函数 中 要 使 用 3 次 。 


/* swap: interchange v[i] and v[j] */ void swap(int v[], int i, int j) 

{ 

int temp; 

temp = vlil; vli] = vlj]; vlj] = temp; 

} 

标准 库 中 提供 了 一 个 qsort 函数 ， 它 可 用 于 对 任何 类 型 的 对 象 排序 。 递 
归并 不 节省 存储 器 的 开销 ， 因 为 递归 调用 过 程 中 必须 在 某 个 地 方 维护 一 
个 存储 处 理 值 


的 校 。 递 归 的 执行 速度 并 不 快 ， 但 递归 代码 比较 紧凑 ， 并 且 比 相应 的 非 
递归 代码 更 易于 编写 


与 理解 。 在 描述 树 等 递归 定义 的 数据 结构 时 使 用 递归 尤其 方便 。 我 们 将 











在 6.5 节 中 介绍 一 个 比 较 好 的 例子 。 


练习 4°12 运用 printd 函数 的 设计 思想 编写 一 个 递归 版 本 的 itoa 函数 ， 
即 通过 递归 调用 把 整数 转换 为 字符 串 。 


练习 4°13 编写 一 个 递归 版 本 的 reverse(S) 函 数 ， 以 将 字符 串 s 倒 
置 。 


4.11 C fibre as 

C 语言 通过 预 处 理 器 提供 了 一 些 语言 功能 。 从 概念 上 讲 ， 预 处 理 器 是 纺 
译 过 程 中 单独 执行 的 第 一 个 步骤 。 两 个 最 常用 的 预 处 理 器 指令 

是 :#include 指令 (用 于 在 编译 期 间 把 指定 文 件 的 内 容 包 含 进 当前 文件 中 ) 
和 #define 指令 (用 任意 字符 序列 替代 一 个 标记 )。 本 节 还 将 介 绍 预 处 理 器 
的 其 它 一 些 特性 ， 如 条 件 编译 与 带 参 数 的 宏 。 


4.11.1. 文件 包含 


文件 包含 指令 ( 即 ##nclude 指令 ) 使 得 处 理 大 量 的 #define 指令 以 及 声明 更 
加 方便 。 在 源 文件 中 ， 任 何 形 如 : 


#include "文件 名 " 








或 
#include < 文件 名 > 

的 行 都 将 被 替换 为 由 文件 名 指定 的 文件 的 内 容 。 如 果 文 件 名 用 引号 引起 
来 ， 则 在 源 文件 所 在 位 置 查 找 该 文件 ;如 果 在 该 位 置 没 有 找到 文件 ， 或 
者 如 果 文 件 名 是 用 尖 插 号 < 与 > 括 起 来 的 ， 则 将 根据 相应 的 规则 查找 该 
文件 ， 这 个 规则 同 具 体 的 实现 有 关 。 被 包含 的 文件 本 喘 也 可 包含 


#include 指令 。 


源 文件 的 开始 处 通常 都 会 有 多 个 #include 指令 ， 它 们 用 以 包含 常见 的 
#define 语句 和 extern 声明 ， 或 从 头 文件 中 访问 库 函数 的 函数 原型 声 
明 ， 比 如 <stdio.h>。( 严 格 地 说 ， 这 些 内 容 没有 必要 单独 存放 在 文件 中 ; 
访问 头 文件 的 细 市 同 具体 的 实现 有 关 。) 


在 大 的 程序 中 ，#include 指令 是 将 所 有 声明 捆绑 在 一 起 的 较 好 的 方法 。 
它 保证 所 有 的 源 文件 都 有 具有 相同 的 定义 与 变量 声明 ， 这 样 可 以 避免 出 
现 一 些 不 必要 的 错误 。 很 自然 ， 如 果 某 个 包含 文件 的 内 容 发 生 了 变 
化 ， 那 么 所 有 依赖 于 该 包含 文件 的 源 文件 都 必须 重新 编译 。 

4.11.2. RBM 

宏 定义 的 形式 如 下 : 

#define 名 字 替换 文本 


这 是 一 种 最 简单 的 宏 蔡 换 一 一 后续 所 有 出 现 名 字 记 号 的 地 方 都 将 被 蔡 
换 为 TRICK 。 

#define 指令 中 的 名 字 与 变量 名 的 命名 方式 相同 ， 蔡 换文 本 可 以 是 任意 
字符 串 。 通 常情 况 下 ， 

#define 指令 占 一 行 ， 蔡 换文 本 是 #define 指令 行 尾 部 的 所 有 剩余 部 分 内 


个 较 长 的 宏 定 义 分 成 寿 干 行 ， 这 时 需要 在 待 续 的 行 末 尾 加 上 一 个 反 和 斜 杠 
符 \。#define 指令 




















定义 的 名 字 的 作用 域 从 其 定义 点 开始 ， 到 被 编译 的 源 文 件 的 末尾 处 结 
束 。 宏 定义 中 也 可 以 使 


用 前 面 出现 的 宏 定 义 。 蔡 换 只 对 记号 进行 ， 对 括 在 引号 中 的 字符 串 不 起 
作用 。 例 如 ， 如 果 YES 


是 一 个 通过 #define 指令 定义 过 的 名 字 ， 则 在 printf("YES") 或 YESMAN 
中 将 不 执行 替换 。 


丛 换 文本 可 以 是 任意 的 ， 例 如 : 








#define forever for (;;) /* infinite loop */ 


该 语句 为 无 限 循 环 定 义 了 一 个 新 名 字 forever. 宏 定 义 也 可 以 带 参数 ， 
这 样 可 以 对 不 同 的 宏 调 用 使 用 不 同 的 替换 文本 。 人 例如， 下列 安定 


义 定 义 了 一 个 宏 max: 
#define max(A, B) ((A) > (B)? (A): (B)) 
使 用 宏 max 看 起 来 很 像 是 函数 词 用 ， 但 宏 调 用 直接 将 符 换 文本 插入 到 


代码 中 。 形 式 参数 (在 此 为 A 或 B) 的 每 次 出 现 都 将 被 痊 换 成 对 应 的 实际 
BR. A, 4: 





x = max(p+q, r+s); 

将 被 符 换 为 下 列 形 式 : 

x = ((ptq) > (rts) ? (ptq) : (r+s)); 

如 果 对 各 种 类 型 的 参数 的 处 理 是 一 致 的 ， 则 可 以 将 同一 个 宏 定 义 应 用 于 


oe 而 无 需 针 对 不 同 的 数据 类 型 需要 定义 不 同 的 max K 


仔细 考虑 一 下 max 的 展开 式 ， 就 会 发 现 它 存在 一 些 缺陷 。 其 中 ， 作 为 
参数 的 表达 式 要 重 复 计算 两 次 ， 如 果 表 达 式 存在 副作用 (比如 含有 自 增 
运算 符 或 输入 /输出 )， 则 会 出 现 不 正确 的 情况 。 例 如 : 

max(i++, j++) /* WRONG */ 


它 将 对 每 个 参数 执行 两 次 目 增 操 作 。 同 时 还 必须 注意 ， 要 适当 使 用 圆 括 
号 以 保证 计算 次 序 的 正确 性 。 考 虑 下 列 宏 定义 : 


#define square(x) x* x /* WRONG */ 


当 用 squrare(z+1) Vil FAA Ee IN HUT TUE? 但 是 ， 宏 还 是 很 有 
价值 的 。<stdio.h> 头 文件 中 有 一 个 很 实用 的 例子 :getchar 与 


putchar 函数 在 实际 中 常常 被 定义 为 宏 ， 这 样 可 以 避免 处 理 字符 时 调用 
函数 所 需 的 运行 时 开 


销 。<ctype.h> 头 文件 中 定义 的 函数 也 种 利 是 通过 宏 实 现 的 。 


可 以 通过 #undef 指令 取消 名 字 的 宏 定 义 ， 这 样 做 可 以 保证 后 续 的 调用 是 
函数 调用 ， 而 不 是 宏 调 用 : 


























#undef getchar 
int getchar(void) { ... } 


形式 参数 不 能 用 带 引 号 的 字符 串 普 换 。 但 是 ， 如 果 在 葵 换 文本 中 ， 参 数 
名 以 # 作 为 前 绥 则 结果 将 被 扩展 为 由 实际 参数 普 换 该 参数 的 带 引 号 的 字 
符 串 。 例 如 ， 可 以 将 它 与 字符 串 连接 运 算 结合 起 来 编写 一 个 调试 打印 
宏 : 





#define dprint(expr) printf(#expr " = %g\n", expr) 
使 用 语句 

dprint(x/y) 

调用 该 宏 时 ， 该 宏 将 被 扩展 为 : 


printf("x/y" " = &g\n", x/y); 
其 中 的 字符 串 被 连接 起 来 了 ， 这 样 ， 该 宏 调用 的 效果 等 价 于 
printf("x/y = &g\n", x/y); 
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文本 中 的 参数 与 


检 相 邻 ， 则 该 参数 将 被 实际 参数 蔡 换 ， 拓 与 前 后 的 空白 符 将 被 删除 ， 并 
对 丛 换 后 的 结果 重新 


扫描 。 例 如 ， 下 面 定义 的 宏 paste 用 于 连接 两 个 参数 


#define paste(front, back) front ## back 








因此 ， 宏 调用 paste(name, 1) 的 结果 将 建立 记号 namel. 
玫 的 众 套 使 用 规则 比较 难以 和 掌握， 详细 细节 请 参阅 附录 A 


练习 4°14 定义 宏 swap(t, x, y) 以 交换 t 类 型 的 两 个 参数 。( 使 用 程 
序 块 结构 会 对 你 有 所 帮助 。) 





4.11.3. 条 件 包 含 


还 可 以 使 用 条 件 语 句 对 预 处 理 本 号 进行 控制 ， 这 种 条 件 语句 的 值 是 在 预 
处 理 执行 的 过 程 中 进行 计算 。 这 种 方式 为 在 编译 过 程 中 根据 计算 所 得 
的 条 件 值 选择 性 地 包含 不 同 代码 提供 了 一 种 手段 。 

HE 语句 对 其 中 的 常量 整 型 表达 式 (其 中 不 能 包含 sizeof、 类 型 转换 运算 


符 或 enum 常 量 ) 进 行 求 值 ， 知 该 表达 式 的 值 不 等 于 0， 则 包含 其 后 的 各 
行 ， 直 到 过 到 #endif、#elif 或 

#else 语句 为 止 ( 预 处 理 器 语句 #elif 类 似 于 else if)。 在 #f 语句 中 可 以 使 用 
表达 式 defined( 名 字 )， 该 表达 式 的 值 遵循 下 列 规则 : 当 名 字 已 经 定义 时 ， 
HEX LEW, HE 为 0。 


例如 ， 为 了 保证 hdr.h 文件 的 内 容 只 被 包含 一 次 ， 可 以 将 该 文件 的 内 容 
包含 在 下 列 形式 的 条 件 语句 中 : 


#if !defined(HDR) 




















#define HDR 

/* hdr.h 文件 的 内 容 放 在 这 里 */ 

#endif 

第 一 次 包含 头 文件 hdrh 时 ， 将 定义 名 字 HDR; 此 后 再 次 包含 该 头 文件 
时 ， 会 发 现 该 名 字 已 经 定义 ， 这 样 将 直接 跳 转 到 #endif 处 。 类 似 的 方式 
也 可 以 用 来 避免 多 次 重复 包含 同一 文件 。 如 果 多 个 头 文件 能 够 一 致 地 
使 用 这 种 方式 ， 那 么 ， 每 个 头 文件 都 可 以 将 它 所 依赖 的 任何 头 文 件 包 
含 进 来 ， 用 户 不 必 考 虚 和 人 处理 头 文件 之 间 的 各 种 依赖 关系 。 


下 面 的 这 段 预 处 理 代码 首先 测试 系统 变量 SYSTEM， 然 后 根据 该 变量 的 
值 确定 包含 哪个 版 本 的 头 文 件 : 


#if SYSTEM == SYSV 





#define HDR "sysv.h" 


#elif SYSTEM == BSD 
#define HDR "bsd.h" 

#elif SYSTEM == MSDOS 
#define HDR "msdos.h" 
#else 

#define HDR "default.h" 
#endif 

#include HDR 


C 语言 专门 定义 了 两 个 预 处 理 语 名 外 fdef SHifndef, Et] FAK Misti ys 
名 字 是 否 已 经 定义 。 上 面 有 关 #f 的 第 一 个 例子 可 以 改写 为 下 列 形式 : 


#ifndef HDR 





#define EDR 
/* hdr.h 文件 的 内 容 放 在 这 里 */ 


#endif 


Boe 指针 与 数组 


旨 针 是 一 种 保存 变量 地 址 的 变量 。 在 C 语言 中 ， 指 针 的 使 用 非常 广泛 ， 
原因 之 一 是 ， 指 针 和 党 第 是 表达 系 个 计算 的 惟一 途径 ， 男 一 个 原因 是 ， 
同 其 它 方 法 比较 起 来 ， 使 用 指针 通常 可 以 生成 更 高 效 、 更 紧凑 的 代 
码 。 指 针 与 数组 之 间 的 关系 十 分 密切 ， 我 们 将 在 本 章 中 讨论 它们 之 间 
的 关系 ， 并 探讨 如 何 利用 这 种 关系 。 


HETA goto 语句 一 样 ， 会 导致 程序 难以 理解 。 如 果 使 用 者 粗心 ， 指 针 
很 容易 就 指 癌 了 错 RATT. (Ee, BREE EA Teer, Ey DAA 
用 它 写 出 简单 、 清 晰 的 程序 。 在 本 半 中 我 们 将 尽力 说 明 这 一 点 。 


ANSI C 的 一 个 最 重要 的 变化 是 ， 它 明确 地 制定 了 操纵 指针 的 规则 。 事 
实 上 ， 这 些 规则 已 经 被 很 多 优秀 的 程序 设计 人 员 和 编译 器 所 采纳 。 此 
Aas C 使 用 类 型 void *( 指 问 void 的 指针 ) 代 丛 char * 作 为 通用 指针 
类 型 。 


5.1 指针 与 地 址 


首先 ， 我 们 通过 一 个 简单 的 示意 图 来 说 明 内 存 是 如 何 组 织 的 。 通 冲 的 机 
名 都 有 一 系列 连续 编写 或 编 址 的 存储 早 元 ， 过 些 存储 单元 可 以 单个 进 
行 操纵 ， 也 可 以 以 连续 成 组 的 方式 操纵 。 通常 情况 下 ， 机 器 的 一 个 字 
节 可 以 存放 一 个 char 类 型 的 数据 ， 两 个 相 邻 的 字 节 存储 单元 可 存 储 一 
个 short( 短 整 型 ) 类 型 的 数据 ， 而 4 个 相 邻 的 字 节 存储 单元 可 存储 一 个 
long( 长 整 型 ) 类 型 的 数据 。 指 针 是 能 够 存放 一 个 地 址 的 一 组 存储 单元 ( 通 
常 是 两 个 或 4 个 字 市 )。 因 此 ， 如 果 c 的 类 型 是 char, IFA pÆ H c 
的 指针 ， 则 可 用 图 5.1 表示 它们 之 间 的 关系 : 

















图 5.1 
一 元 运算 符 攻 可 用 于 取 一 个 对 象 的 地 址 ， 因 此 ， 下 列 语 句 : 


p= &c; 


将 把 c 的 地 址 赋值 给 变量 p， 我 们 称 p 为 "指向 ”cc 的 指针 。 地 址 运算 符 
& 只 能 应 用 于 内 存 中 的 对 象 ， 即 变量 与 数组 元 素 。 它 不 能 作用 于 表达 
式 、 常 量 或 register 类 型 的 变量 。 


一 元 运算 符 * 是 间接 寻 址 或 间接 引用 运算 符 。 当 和 它 作 用 于 指针 时 ， 将 访 
问 指针 所 指 回 的 对 象 。 我 们 在 这 里 假定 x 与 y 是 整数 ， 而 ip 是 指 疝 int 
类 型 的 指针 ， 下 面 的 代码 段 说 明了 如 何在 程序 中 声明 指针 以 及 如 何 使 
Hiz T&A: 














int x = 1, y = 2, z[10]; 


int *ip; /* ip is a pointer to int */ 


ip = &x; /* ip now points to x */ 


y = “Ip; /* y is now 1 */ 
*ip = 0; /* x is now 0 */ 
ip = &z[0]; /* ip now points to z[0] */ 





变量 x、y 与 z 的 声明 方式 我 们 已 经 在 前 面 的 章节 中 见 到 过 。 我 们 来 看 
指针 ip 的 声明 ， 如 下 所 示 : 


int *ip; 

这 样 声明 是 为 了 便于 记忆 。 该 声明 语句 表明 表达 式 *ip 的 结果 是 int 类 
型 。 这 种 声明 变量 的 语法 与 声明 该 变量 所 在 表达 式 的 语法 类 似 。 同 样 
的 原因 ， 对 函数 的 声明 也 可 以 采用 这 种 方式 。 例如 ， 声 明 

double *dp, atof(char *); 


表明 ， 在 表达 式 中 ，*dp 和 atof(s) 的 值 都 是 double 类 型 ， 且 atof 的 参数 


是 一 个 指 同 char 
类 型 的 指针 。 


我 们 应 该 注意 ， 指 针 只 能 指向 某 种 特定 类 型 的 对 象 ， 也 就 是 说 ， 每 个 指 
针 都 必须 指向 某 种 特定 的 数据 类 型 。( 一 个 例外 情况 是 指向 void 类 型 的 
指针 可 以 存放 指 问 任何 类 型 的 指针 ， 但 它 不 能 间接 引用 其 自身 。 我 们 
将 在 5.11 节 中 详细 讨论 该 问题 )。 


如 果 指 针 ip 指向 整 型 变量 ， 那 么 在 x 可 以 出 现 的 任何 上 下 文中 都 可 以 
使 用 *ip， 因 此 ， 语句 























*ip = *ip + 10; 


将 把 *ip 的 值 增加 10。 一 元 运算 符 * 和 & 的 优先 级 比 算术 运算 符 的 优先 
级 高 ， 因 此 ， 赋 值 语 名 


y=*ip+1 


将 把 *ip 指向 的 对 象 的 值 取 出 并 加 1， 然 后 再 将 结果 赋值 给 y， 而 下 列 赋 
;五 


值 语句 : 

*ip += 1 

则 将 ip 指向 的 对 象 的 值 加 1， 它 等 同 于 

++*ip 

或 

(*ip)++ 

语句 的 执行 结果 。 语 句 (*ip)++ 中 的 圆 括 号 是 必需 的 ， 否 则 ， 该 表达 式 将 
对 ip 进行 加 1 运算， 而 不 是 对 ip 指 回 的 对 象 进行 加 1 运算， 这 是 因 
为 ， 类 似 于 * 和 ++ 这 样 的 一 元 运算 符 遵 循 从 右 至 左 的 结合 顺序 。 

最 后 说 明 一 点 ， 由 于 指针 也 是 变量 ， 所 以 在 程序 中 可 以 直接 使 用 ， 而 不 


必 通 过 间接 引用 的 方法 使 用 。 例 如 ， 如 有 果 ig 古 为 一 个 指向 整 型 的 指 
针 ， 那 么 语句 

















iq = ip 
将 把 ip PRE I SI iq 中， 这样 ， 指 针 ig HEB ip 指 癌 的 对 象 。 


5.2 指针 与 函数 参数 


由 于 C 语言 是 以 传 值 的 方式 将 参数 值 传 递 给 被 调用 函数 。 因 此 ， 被 调用 
函数 不 能 直接 修 改 主 调 函 数 中 变 最 的 值 。 例 如 ， 排 序 函 数 可 能 会 使 用 
一 个 名 为 swap 的 函数 来 交换 两 个 次 序 颠 倒 的 元 素 。 但 是 ， 如 果 将 swap 
函数 定义 为 下 列 形式 : 


void swap(int x, int y) /* WRONG */ 





{ 

int temp; 

temp = x; x =y; 

y = temp; 

} 

则 下 列 语句 无 法 达到 该 目的 。 

swap(a, b); 

这 是 因为 ， 由 于 参数 传递 采用 传 值 方式 ， 因 此 上 述 的 swap 函数 不 会 影 
CM PIE HAY 参数 a Alb 的 值 。 该 函数 仅仅 交换 了 a 和 的 副 


那么 ， 如 何 实现 我 们 的 目标 昵 ， 可 以 使 主 调 程序 将 指向 所 要 交换 的 变量 
的 指针 传递 给 被 调用 函数 ， 即 : 


swap(&a, &b); 


由 于 一 元 运算 人 符 && 用 来 取 变 量 的 地 址 ， 这 样 &a 束 是 一 个 指 向 变量 a 的 指 
Fo swap 函数 的 所 有 参数 都 声明 为 指针 ， 并 且 通 过 这 些 指针 来 间接 访 
问 它 们 指 疝 的 操作 数 。 





void swap(int *px, int *py) /* interchange *px and *py */ 


{ 

int temp; 

temp = *px; 

“px = “Dy; 

“py = temp; 

} 

我 们 通过 图 5°2 进行 说 明 。 








图 5.2 


指针 参数 使 得 被 调用 函数 能 够 访问 和 修改 主 调 函数 中 对 象 的 值 。 我 们 来 
看 这 样 一 个 例子 : PBL getint 接受 目 由 格式 的 输入 ， 并 执行 转换 ， 将 输 
入 的 字符 流 分 解 成 整数 ， 且 每 次 调用 得 到 一 个 整数 。getint 需要 返回 转 
换 后 得 到 的 整数 ， 并 且 ， 在 到 达 输 入 结尾 时 要 返回 文件 结 束 标 记 。 这 
些 值 必须 通过 不 同 的 方式 返回 。EOF( 文 件 结束 标记 ) 可 以 用 任何 值 表 
示 ， 当 然 也 可 用 一 个 输入 的 整数 表示 。 


可 以 这 样 设计 该 函数 :将 标识 是 否 到 达 文 件 结 尾 的 状态 作为 getint 函数 的 
返回 值 ， 同 时 ， 使 用 一 个 指针 参数 存储 转换 后 得 到 的 整数 并 传 回 给 主 
WARK AC. PAA scanf 的 实现 就 采用 了 这 种 方法 ， 有 具体 细节 请 参见 7.4 
TS 





下 面 的 循环 语句 调用 getint 函数 给 一 个 整 型 数组 赋值 : 

int n, array[SIZE], getint(int *); 

for (n = 0; n < SIZE && getint(&array[n]) != EOF; n++) 

每 次 调用 getint 时 ， 输 入 流 中 的 下 一 个 整数 将 被 赋值 给 数组 元 素 


array[n]， 同 时 ，n 的 值 将 增加 1。 请 注意 ， 这 里 必须 将 array[n] 的 地 址 
传递 给 函数 getint， 人 否则 函数 getint 将 无 法 把 转换 得 到 的 整数 传 回 给 调 
用 者 。 


该 版 本 的 getint 函数 在 到 达 文 件 结尾 时 返回 EOF， 当 下 一 个 输入 不 是 数 
字 时 返回 0， 当 输入 中 包含 一 个 有 意义 的 数字 时 返回 一 个 正 值 。 


#include <ctype.h> 

int getch(void); void ungetch(int); 

/* getint: get next integer from input into *pn */ int getint(int *pn) 
{ 

int c, sign; 


while (isspace(c = getch())) /* skip white space */ 


if (lisdigit(c) && c != EOF && c !='+' && c !="*') { ungetch(c); ie 
it is not a number */ 


return 0; 

} 

sign = (c ==") ?e1: 1; 

if (c == '+' || c == '*') c = getch(); 

for (*pn = 0; isdigit(c), c = getch()) 

*pn = 10 * *pn + (c * '0); 

*pn *= sign; if (c != EOF) 

ungetch(c); return c; 

} 

在 getint 函数 中 ，*pn 始终 作为 一 个 普通 的 整 型 变量 使 用 。 其 中 还 使 用 
了 getch 和 ungetch 两 个 函数 (参见 4.3 节 )， 借 助 这 两 个 函数 ， 函 数 
getint 必须 读 入 的 一 个 多 余 字 符 就 可 以 重 新 写 回 到 输入 中 。 

练习 5°1 在 上 面 的 例子 中 ， 如 宁 符 号 + 或 "的 后 面 紧 跟 的 不 是 数 
F, getint 函数 将 把 符号 视 为 数字 0 的 有 效 表 达 方 式 。 修 改 该 函数 ， 将 
这 种 形式 的 + 或 " 符 写 重 新 写 回 到 输入 流 中 。 


练习 592 模仿 函数 getint 的 实现 方法 ， 编 写 一 个 读 取 浮 点 数 的 函 
数 getfloat。 getfloat 函数 的 返回 值 应 该 是 什么 类 型 ? 


5.3 指针 与 数组 


在 C 语言 中 ， 指 针 和 数组 之 间 的 关系 十 分 密切 ， 因 此 ， 在 接 下 来 的 部 分 
中 ， 我 们 将 同时 讨论 指针 与 数组 。 通 过 数组 下 标 所 能 完成 的 任何 操作 
都 可 以 通过 指针 来 实现 。 一 般 来 说 ， 用 指针 编写 的 程序 比 用 数组 下 标 
编写 的 程序 执行 速度 快 ， 但 另 一 方面 ， 用 指针 实现 的 程序 理解 起 来 稍 








微 困难 一 些 。 

声明 

int a[10]; 

定义 了 一 个 长 度 为 10 的 数组 a。 换 句 话 说 ， 它 定义 了 一 个 由 10 个 对 象 


组 成 的 集合 ， 这 10 个 对 象 存储 在 相 邻 的 内 存 区 域 中 ， 名 字 分 别 为 
a[0]、a[1]、 、a[9]( 参 见 图 5.3)。 


a: | 
1 


a[0] a[1] a[9] 





图 5.3 
a[i] 表 示 该 数组 的 第 i 个 元 素 。 如 果 pa 的 声明 为 
int *pa; 


UBL H Ee ET TET, ABA WER 


pa = &a[0]; 


则 可 以 将 指针 pa 指向 数组 a 的 第 0 个 元 素 ， 也 就 是 说 ，pa 的 值 为 数组 
元 素 a[0] 的 地 址 ( 参 见 图 5.4)。 


pa: 


图 5.4 

这 样 ， 赋 值 语句 

x = *pa; 

将 把 数组 元 素 a[0] 中 的 内 容 复制 到 变量 x 中 。 


如 果 pa 指 疝 数组 中 的 某 个 特定 元 素 ， 那 么 ， 根 据 指针 运算 的 定义 ， 
pa+1 将 指向 下 一 个 元素 ，pa+i 将 指向 pa 所 指 问 数 组 元 素 之 后 的 第 i 个 
JTA, M pai 将 指向 pa 所 指向 数组 元 素 之 前 的 第 i 个 元 素 。 因 此 ， 如 
果 指 针 pa fale] a[0]， 那 么 *(pa+1) 引 用 的 是 数组 元 素 a[1] 的 内 容 ，pati 
是 数组 元 素 a 中 的 地 址 ，*(pat+i) 引 用 的 是 数组 元 素 a 中 的 内 容 ( 参 WA 
565). 








pa: pati: -n pat2: ~ 





图 5°5 


无 论 数组 a 中 元 系 的 类 型 或 数组 长 度 是 什么 ， 上 面 的 结论 部 成 立 。" 指 
针 加 1" 束 意味 看 ， pa+1 Talal pa 所 指 癌 的 对 象 的 下 一 个 对 象 。 相 应 地 ， 
pati 指向 pa 所 指向 的 对 象 之 后 的 第 i 个 对 象 。 





下 标 和 指针 运算 之 间 具 有 密切 的 对 应 关系 。 根 据 定 义 ， 数 组 类 型 的 变量 
或 表达 式 的 值 是 该 数组 第 0 个 元 系 的 地 址 。 执 行 赋值 语句 


pa = &a[0]; 


后 ，pa 和 a 具有 相同 的 值 。 因 为 数组 名 所 代表 的 就 是 该 数组 最 开始 的 一 
个 元 素 的 地 址 ， 所 以 ， 赋值 语句 pa=&a[0] 也 可 以 写成 下 列 形式 : 


pa =a; 


mp BAA 7c ze a 中 的 引用 也 可 以 写成 *(ati) 这 种 形式 。 对 第 一 次 接触 这 种 写 
法 的 人 来 说 ， 可 能 会 觉得 很 奇怪 。 在 计算 数组 元 素 ali] 的 值 时 ，C 语言 
实际 上 先 将 其 转换 为 *(ati) 的 形 式 ， 然 后 再 进行 求 值 ， 因 此 在 程序 中 这 
两 种 形式 是 等 价 的 。 如 果 对 这 两 种 等 价 的 表示 形式 分 别 施 加 地 址 运算 
符 &&， 便 可 以 得 出 这 样 的 结论 :&a[i] 和 ati 的 含义 也 是 相同 的 。ati 是 a 


之 后 第 i 个 元 素 的 地 址 。 相 应 地 ， 如 果 pa 是 A tts MWA, ERIAN 
中 也 可 以 在 它 的 后 面 加 下 标 。pa[i 与 *(pa+i 是 等 价 的 。 简 而 言 之 ， 一 个 
通过 数组 和 下 标 实现 的 表达 式 可 等 价 地 通过 指 针 和 偏 移 量 量 实现 。 


但 是 ， 我 们 必须 记 住 ， 数 组 名 和 指针 之 间 有 一 个 不 同 之 处 ， 指 针 是 一 个 
变量 ， 因 此 ， 在 C 语言 中 ， 语 句 paza 和 pa++ 都 是 合法 的 。 但 数组 名 不 
是 变量 ， 因 此 ， 类 似 于 a=pa 和 a++ 形 式 的 语句 是 非法 的 。 


Pere o M 数 时 ， 实 际 上 传递 的 是 该 数组 第 一 个 元 索 的 地 
。 在 被 调用 函 数 中 ， 该 参数 是 一 个 局 部 变量 ， 因 此 ， 数 组 名 参数 必 

针 ， 也 就 是 一 个 存储 地 址 值 的 变量 。 我 们 可 以 利用 该 特性 

编写 strlen 函数 的 另 一 个 版 本 ， 该 函数 用 于 计算 一 个 字符 串 的 长 度 。 





/* strlen: return length of string s */ int strlen(char *s) 

{ 

int n; 

for (n = 0; *s != '\0'", s++) n++; 

return n; 

} 

因为 s 是 一 个 指针 ， 所 以 对 其 执行 目 增 运算 是 合法 的 。 执 行 s++ 运 算 不 


会 影响 到 strlen K 数 的 调用 者 中 的 字符 串 ， 它 仅 对 该 指针 在 strlen 函数 
中 的 私有 副本 进行 自 增 运算 。 因 此 ， 类 似 于 下 面 这 样 的 函数 调用 : 





strlen("hello, world"); /* string constant */ 
strlen(array); /* char array[100]; */ 
strlen(ptr); /* char *ptr; */ 


都 可 以 正确 地 执行 。 在 函数 定义 中 ， 形 式 参数 


char s| |; 


和 

char *s; 

是 等 价 的 。 我 们 通常 更 习惯 于 使 用 后 一 种 形式 ， 因 为 它 比 前 者 更 直观 地 
表明 了 该 参数 是 一 个 指针 。 如 果 将 数组 名 传递 给 函数 ， 函 数 可 以 根据 
情况 判定 是 按照 数组 处 理 还 是 按照 指针 处 理 ， 随后 根据 相应 的 方式 操 
作 该 参数 。 为 了 直观 且 恰 当地 摘 述 函数 ， 在 函数 中 甚至 可 以 同时 使 用 
数组 和 指针 这 两 种 表示 方法 。 


也 可 以 将 指向 子 数组 起 始 位 置 的 指针 传递 给 函数 ， 这 样 ， 就 将 数组 的 一 
部 分 传递 给 了 函 数 。 例 如 ， 如 果 a 是 一 个 数组 ， 那 么 下 面 两 个 函数 调用 


f(&a[2]) 
E 
f(a+2) 


都 将 把 起 始 于 a[2] 的 子 数组 的 地 址 传递 给 函数 f。 在 函数 f 中 ， 参 数 的 
声明 形式 可 以 为 








f(int arr[]) { ... } 
或 
f(int *arr) { ... } 


对 于 函数 f 来 说 ， 它 并 不 关心 所 引用 的 是 人 否 只 是 一 个 更 大 数组 的 部 分 元 
Ao 如 果 确 信 相 应 的 元 素 存 在 ， 也 可 以 通过 下 标 访 问 数 组 第 一 个 元 系 
之 前 的 元 素 。 类 似 于 


p[*1]、p[*2] 这 样 的 表达 式 在 语法 上 都 是 合法 的 ， 它 们 分 别 引 用 位 于 p[0] 
之 前 的 两 个 元 素 。 


当然 ， 引 用 数组 边界 之 外 的 对 象 是 非法 的 。 
5.4 地 址 算术 运算 


WR p 是 一 个 指 疝 数组 中 某 个 元 系 的 指针 ， 那 么 p++ 将 对 p 进行 目 增 运 
算 并 指向 下 一 个 元 素 ， 而 p+=i 将 对 p 进行 加 i 的 增 量 运算 ， 使 其 指向 
指针 p 当前 所 指向 的 元 素 之 后 的 第 i 个 元 素 。 这 类 运算 是 指针 或 地 址 算 
术 运 算 中 最 简单 的 形式 。 


C 语言 中 的 地 址 算术 运算 方法 是 一 臻 是 有 规律 的 ， 将 指针 、 数 组 和 地 址 
的 算术 运算 集成 在 一 起 是 该 语言 的 一 大 优点 。 为 了 说 明 这 一 点 ， 我 们 
来 看 一 个 不 完善 的 存储 分 配 程序 。 它 由 两 个 函数 组 成 。 第 一 个 函数 
alloc(n) 返 回 一 个 指 问 n 个 连续 字符 存储 单元 的 指针 ，alloc K 数 的 调用 
者 可 利用 该 指针 存储 字符 序列 。 第 二 个 函数 afree(p) 释 放 已 分 配 的 存储 
空间 ， 以 便 以 后 重用 。 之 所 以 说 这 两 个 函数 是 "不 完善 的 "， 是 因为 对 
afree 函数 的 调用 次 序 必 须 与 调用 alloc 函数 的 次 序 相 反 。 换 名 话说， 
alloc 与 afree 以 校 的 方式 ( 即 后 进 先 出 的 列表 ) 进行 存储 空间 的 管理 。 标 
准 库 中 提供 了 具有 类 似 功 能 的 函数 malloc 和 free， 它 们 没有 上 述 IR 

制 ， 我 们 将 在 8.7 节 中 说 明 如 何 实现 这 些 函 数 。 


最 容易 的 实现 方法 是 让 alloc 函数 对 一 个 大 字符 数组 allocbuf 中 的 空间 
进行 分 配 。 该 数组 是 alloc 和 afree 两 个 函数 私有 的 数组 。 由 于 函数 
alloc 和 afree 处 理 的 对 象 是 指 针 而 不 是 数组 下 标 ， 因 此 ， 其 它 函 数 无 需 
知道 该 数组 的 名 字 ， 这 样 ， 可 以 在 包含 alloc 和 afree 的 源 文件 中 将 该 数 
































组 声明 为 static 类 型 ， 使 得 它 对 外 不 可 见 。 实 际 实现 时 ， 该 数组 其 至 可 
以 没有 名 字 ， 它 可 以 通过 调用 malloc 函数 或 向 操作 系统 申请 一 个 指向 
无 名 存储 块 的 指针 获 得 。 


allocbuf 中 的 空间 使 用 状况 也 是 我 们 需要 了 解 的 信息 。 我 们 使 用 指针 
allocp 44/4] allocbuf 中 的 下 一 个 空闲 单元 。 当 调用 alloc 申请 mn 个 字符 的 
空间 时 ，alloc 检查 allocbuf 数组 中 有 没有 足够 的 剩余 空间 。 如 果 有 足够 
的 空闲 空间 ， 则 alloc 返回 allocp 的 当前 值 ( 即 空闲 块 的 开始 位 置 )， 然 后 
将 allocp JH n 以 使 它 指 问 下 一 个 空间 区 域 。 如 果 空 朵 空间 不 够 ， 则 
alloc 返回 0。 如 果 p 在 allocbuf 的 边界 之 内 ， 则 afree(p) 仅 仅 只 是 将 
allocp 的 值 设置 为 p( 参 见 图 56)。 


#define ALLOCSIZE 10000 /* size of available space */ 





static char allocbuf[ALLOCSIZE]; /* storage for alloc */ static char *allocp = 


allocbuf; /* next free position */ 
char *alloc(int n) /* return pointer to n characters */ 
{ 


if (allocbuf + ALLOCSIZE « allocp >= n) { /* it fits */ allocp += n; 


return allocp ° n; /* old p */ 


} else /* not enough room */ return 0; 

} 

void afree(char *p) /* free storage pointed to by p */ 
{ 


if (p >= allocbuf && p < allocbuf + ALLOCSIZE) allocp = p; 




















before call to alloc: 
allocp: ~ 
allocbut: | | | 
+—— in use + free - 
after call to alloc: eile -m 
allocbuf: | | | | | 
“ in use ea free - 
图 5.6 


一 般 情 况 下 ， 同 其 它 类 型 的 变量 一 样 ， 指 针 也 可 以 初始 化 。 通 季 ， 对 指 
针 有 意义 的 初始 化 值 只 能 是 0 或 者 是 表示 地 址 的 表达 式 ， 对 后 者 来 

说 ， 表 达 式 所 代表 的 地 址 必须 是 在 此 前 已 定义 的 具有 适当 类 型 的 数据 
的 地 址 。 例 如 ， 声 明 








static char* allocp = allocbuf; 


将 allocp 定义 为 字符 类 型 指针 ， 并 将 它 初 始 化 为 allocbuf 的 起 始 地 址 ， 
OR 序 执行 时 的 下 一 个 空 闪 位置。 上 述 语句 也 可 以 写成 下 
列 形式 : 


static char* allocp = &allocbuf[0]; 











这 是 因为 该 数组 名 实际 上 就 是 数组 第 0 个 元 素 的 地 址 。 下 列 证 测试 语 


HJ: 
if (allocbuf + ALLOCSIZE œ allocp >= n) { /* it fits */ 


检查 是 否 有 足够 的 空闲 空间 以 满足 mn 个 字符 的 存储 空间 请 求 。 如 果 空 亲 
空间 足够 ， 则 分 配 存 储 空 间 后 allocp 的 新 值 至 多 比 allocbuf 的 尾 端 地 址 
大 1。 如果 存储 空间 的 申请 可 以 满足 ，alloc 将 返回 一 个 指 问 所 需 大 小 的 
字符 块 首 地 址 的 指针 (注意 函数 本 身 的 声明 )。 如 果 申 请 无 法 满足 ，alloc 
必须 返回 某 种 形式 的 信号 以 说 明 没有 足够 的 空闲 空间 可 供 分 配 。C 语言 
PRUE, 0 永远 不 是 有 效 的 数据 地 址 ， 因 此 ， 返 回 值 0 可 用 来 表示 发 生 了 
异常 事件 。 在 本 例 中 ， 返 回 值 


0 表示 没有 足够 的 空闲 空间 可 供 分 配 。 

指针 与 整数 之 间 不 能 相互 转换 ， 但 0 是 惟一 的 例外 :常量 0 可 以 赋值 给 
指针 ， 指 针 也 可 以 和 常量 0 进行 比较 。 程 序 中 经 常用 符号 常量 NULL 
代 蔡 常量 0， 这 样 便于 更 清晰 地 说 明和 常量 0 是 指针 的 一 个 特殊 值 。 符 号 
常量 NULL 定义 在 标准 头 文件 <stddef.h> 中 。 我 们 在 后 面部 分 经 常会 用 
到 NULL. 


类 似 于 








if (allocbuf + ALLOCSIZE。allocp >= n) { /* it fits */ 

以 及 

if (p >= allocbuf && p < allocbuf + ALLOCSIZE) 

的 条 件 测试 语句 表明 指针 算术 运算 有 以 下 几 个 重要 特点 。 首 先 ， 在 某 些 
情况 下 对 指针 可 以 进行 比较 运算 。 例 如 ， 如 果 指 针 p 和 q 指向 同一 个 
数组 的 成 员 ， 那 么 它们 之 间 就 可 以 进行 类 似 于 ==、!=、<、>= 的 关系 比 


PUS WR p 指 疝 的 数组 元 系 的 位 置 在 q 指 癌 的 数组 元 素 位 置 之 
前 ， 那 么 关系 表达 式 





p<q 


的 值 为 真 。 任 何 指针 与 0 进行 相等 或 不 等 的 比较 运算 都 有 意义 。 但 是 ， 

指 癌 不 同 数 组 的 元 系 的 指针 之 间 的 算术 或 比较 运算 没有 定义 。( 这 里 有 

人 
o ) 





A 人 
H, 和 


ptn 


表示 指针 p 当前 指向 的 对 象 之 后 第 n 个 对 象 的 地 址 。 无 论 指 针 p 指向 的 
对 象 是 何 种 类 型 ， 上 述 结论 都 成 立 。 在 计算 p+tn 时 ，n 将 根据 p 指 辐 的 
对 象 的 长 度 按 比例 缩放 ， 而 p 指向 的 对 象 的 长 度 则 取决 于 Pp 的 声明 。 
例如 ， 如 果 int 类 型 占 4 个 字 节 的 存储 空间 ， 那 么 在 int 类 型 的 计算 
中 ， 对 应 的 n 将 按 4 的 倍数 来 计算 。 


指针 的 减法 运算 也 是 有 意义 的 :如 果 p 和 qd 指 同 相同 数组 中 的 元 索 ， 且 
p<q, ABA qep 就 是 位 于 p 和 9g 指 辣 的 元 索 之 间 的 元 素 的 数 日 。 我 们 
由 此 可 以 编写 出 函数 strlen 的 另 一 个 版 本 ， 如 下 所 示 : 

















/* strlen: return length of string s */ int strlen(char *s) 


{ 


char *p = S; 

while (*p != \0') p++; 
return p ° s; 

} 


在 上 述 程序 段 的 声明 中 ， 指 针 p 被 切 始 化 为 指 回 s， 即 指 辣 该 字符 串 的 
第 一 个 字符 。while 循环 语句 将 依次 检查 字符 串 中 的 每 个 字符 ， 直 到 遇 
到 标识 字符 数组 结尾 的 字符 \0' 为 止 。 由 于 p 是 指向 字符 的 指针 ， 所 以 
每 执行 一 次 p++，p 就 将 指 癌 下 一 个 字符 的 地 址 ，ps*s 则 表示 已 经 检查 
过 的 字符 数 ， 即 字符 串 的 长 度 。( 字 符 串 中 的 字符 数 有 可 能 超过 int 类 型 
所 能 表示 的 最 大 范围 。 头 文件 <stddef.h> 中 定义 的 类 型 ptrdiff t 足以 表 
示 两 个 指针 之 间 的 带 符 号 差 值 。 但 是 ， 我 们 在 这 里 使 用 size_t 作为 函数 
strlen 的 返回 值 类 型 ， 这 样 可 以 与 标准 库 中 的 函数 版 本 相 匹 配 。Size t 
是 由 运算 符 sizeof 返回 的 无 符号 整 型 。) 


指针 的 算术 运算 具有 一 致 性 :如 果 处 理 的 数据 类 型 是 比 字 符 型 占据 更 多 
存储 空间 的 浮 点 KW, FH p 是 一 个 指 同 浮 点 类 型 的 指针 ， 那 么 在 执 
行 p++ 后 ，p 将 指 问 下 一 个 浮 点 数 的 地 址 。 因 此 ， 只 需要 将 alloc 和 
afree 函数 中 所 有 的 char 类 型 奉 换 为 float 类 型 ， 就 可 以 得 到 一 个 适用 于 
浮 点 类 型 而 非 字 符 型 的 内 存 分 配 函 数 。 所 有 的 指针 运算 都 会 上 自动 考虑 它 
所 指 问 的 对 象 的 长 度 。 



































有 效 的 指针 运算 包括 相同 类 型 指针 之 间 的 赋值 运算 ;指针 同 整数 之 间 的 
加 法 或 减法 运算 ; 指向 相同 数组 中 元 素 的 两 个 指针 间 的 减法 或 比较 运算 ; 
将 指针 赋值 为 0 或 指针 与 0 之 间 的 比 较 运 算 。 其 它 所 有 形式 的 指针 运 
算 都 是 非法 的 ， 例 如 两 个 指针 间 的 加 法 、 乘 法 、 除 法 、 移 位 或 屏蔽 运 
算 ; 指 针 同 float 或 double 类 型 之 间 的 加 法 运算 ;不 经 强制 类 型 转换 而 直接 
将 指 加 一 种 类 型 对 象 的 指针 赋值 给 指 回 为 一 种 类 型 对 象 的 指针 的 运算 
(两 个 指针 之 一 是 void * 类 型 的 情况 除外 )。 


5.5 字符 指针 与 图 数 字符 串 第 量 是 一 个 字符 数组 ， 
例如 : "Iam a string" 


在 字符 串 的 内 部 表示 中 ， 字 符 数 组 以 空 字符 \0' 结 尾 ， 所 以 ， 程 序 可 以 通 
过 检查 空 字符 找到 


0 E 
符 数 大 1。 


字符 串 常 量 最 常见 的 用 法 也 许 是 作为 函数 参数 ， 例 如 : 


























princf("hello, world\n"}; 


当 类 似 于 这 样 的 一 个 字符 串 出 现在 程序 中 时 ， 实 际 上 是 通过 字符 指针 访 
问 该 字符 串 的 。 在 上 述 语句 中 ，printf 接受 的 是 一 个 指向 字符 数组 第 一 
个 字符 的 指针 。 也 束 是 说 ， 字 符 串 常量 可 通过 一 个 指 网 其 第 一 个 元 素 
的 指针 访问 。 

除了 作为 函数 参数 外 ， 字 符 串 常量 还 有 其 它 用 法 。 假 定 指 针 pmessage 
的 声明 如 下 : 

char *pmessage; 

那么 ， 语 名 


pmessage ="now is the time"; 


将 把 一 个 指 同 该 字符 数组 的 指针 赋值 给 pmessage。 该 过程 并 没有 进行 字 
符 串 的 复制 ， 而 只 是 涉及 到 指针 的 操作 。C 语言 没有 提供 将 整个 字符 串 


作为 一 个 整体 进行 处 理 的 运算 符 。 


下 面 两 个 定义 之 间 有 很 大 的 差别 : 
char amessage[] = "nw is the time"; /* 定义 一 个 数组 */ char 
*pmessage = "now is the time"; Pere ee td 


上 述 声明 中 ，amessage 是 一 个 仅仅 足以 存放 初始 化 字符 串 以 及 空 字 

符 \0' 的 一 维 数组 。 数 组 中 的 单个 字符 可 以 进行 修改 ， 但 amessage 始终 
指向 同一 个 存储 位 置 。 另 一 方面 ，pmessage 是 一 个 指针 ， 其 初 值 指 向 一 
个 字符 串 常 量 ， 之 后 它 可 以 被 修改 以 指 同 其 它 地 址 ， 但 如 果 试 图 修改 
字符 串 的 内 容 ， 结 果 是 没有 定义 的 (参见 图 5.7). 


ree] 
amessage: ef now is the time\0 


pmessage: now is the time\0 








图 5.7 





为 了 更 进一步 地 讨论 指针 和 数组 其 它 方 面 的 问题 ， 下 面 以 标准 库 中 两 个 
有 用 的 函数 为 例 来 研究 它们 的 不 同 实现 版 本 。 第 一 个 函数 strcpy(s, D 把 
Het t 指 癌 的 字符 串 复制 到 指针 s 指 癌 的 位 置 。 如 果 使 用 语句 s=t 实现 
该 功能 ， 其 实质 上 只 是 找 贝 了 指针 ， 而 并 没有 复制 字 符 。 为 了 进行 字 
符 的 复制 ， 这 里 使 用 了 一 个 循环 语句 。strcpy 函数 的 第 1 个 版 本 是 通过 
数组 方法 实现 的 ， 如 下 所 示 : 


/* strcpy: copy t to s; array subscript version */ void strcpy(char *s, 
char *t) 


while ((s[i] = t[i]) {= \0) i++; 
} 
为 了 进行 比较 ， 下 面 是 用 指针 方法 实现 的 strcpy 函数 : 


/* strcpy: copy t to s; pointer version */ void strcpy(char *s, char *t) 


while ((*s = *t) != \0") { s++; 
t++; 

} 

} 


因为 参数 是 通过 值 传递 的 ， 所 以 在 strcpy 函数 中 可 以 以 任何 方式 使 用 参 

数 s 和 t。 在 此 ，s 和 t 是 方便 地 进行 了 初始 化 的 指针 ， 循 环 每 执行 一 

9 人 E 站 字符， 直到 将 t 中 的 结束 符 \0' 复 制 
Ils IE. 


实际 上 ，strcpy 函数 并 个 会 按照 上 面 的 这 些 方式 编号。 经验 丰 遇 的 程序 
员 更 喜欢 将 它 编 写成 下 列 形 式 : 











/* strcpy: copy t to s; pointer version 2 */ void strcpy(char *s, char 


{ 


while ((*s++ = *t++) != '\0') 


} 


在 该 版 本 中 ，s 和 +t 的 上 自 增 运算 放 到 了 循环 的 测试 部 分 中 。 表 达 式 
*t++ 的 值 是 执行 目 增 运算 之 前 t 所 指 癌 的 人 字符。 后 级 运算 符 ++ 表 示 在 读 
取 该 字符 之 后 才 改 变 t 的 值 。 同 样 的 道理 ， 在 s 执行 目 增 运算 之 前 ， 字 
符 就 被 存储 到 了 指针 s 指向 的 旧 位置 。 该 字符 值 同 时 也 用 来 和 空 F 

符 \0' 进 行 比较 运算 ， 以 控制 循环 的 执行 。 最 后 的 结果 是 依次 将 t 指 癌 的 
字符 复制 到 s 指 向 的 位 置 ， 直 到 过 到 结束 符 \0' 为 止 (同时 也 复制 该 结束 
从)， 

为 了 更 进一步 地 精炼 程序 ， 我 们 注意 到 ， 表 达 式 同 \0' 的 比较 是 多 余 的 ， 


因为 只 需要 判 断 表 达 式 的 值 是 否 为 0 即 可 。 因 此 ， 该 函数 可 进一步 写 
成 下 列 形式 : 














/* strcpy: copy t to s; pointer version 3 */ void strcpy(char *s, char 


{ 
while (*s++ = *t++) 
} 


该 函数 初 看 起 来 不 太 容易 理解 ， 但 这 种 表示 方法 是 很 有 好 处 的 ， 我 们 应 
该 掌握 这 种 方法 ，C 语 Sey PAH ARH SK. 


标准 库 (<string.h>) 中 提供 的 函数 strcpy 把 目标 字 符 串 作为 函数 值 返 回 。 
函数 stremp(s, D。 该 函数 比较 字符 
s Al t, 


e a a a 
或 正 整 数 。 该 返回 值 


eee 逐 字 符 比 较 时 过 到 的 第 一 个 不 相等 字符 处 的 字符 的 差 














/* strcmp: return <0 if s<t, 0 if s==t, >0 if s>t */ int strcmp(char *s, 
char *t) 


{ 

int i; 

for (i = 0; s[i] == t[i]; i++) 

if (s[i] == '\0') return 0; 

return s[i] ° tli]; 

} 

下 面 用 是 指针 方式 实现 的 strcmp 函数 : 


/* strcmp: return <0 if s<t, 0 if s==t, >0 if s>t */ int strcmp(char *s, 
char *t) 


{ 

for (; *s == *t; s++, t++) if (*s == '\0') 

return 0; return *s 。 *t; 

} 

由 于 ++ 和 … 既 可 以 作为 前 绥 运 算 待 ， 也 可 以 作为 后 缀 运算 待 ， 所 以 还 可 


以 将 运算 符 * 与 运算 待 ++ 和 "按照 其 它 方式 组 合 使 用 ， 但 这 些 用 法 并 不 
多 见 。 例 如 ， 下 列表 达 式 








Keen 


在 读 取 指针 p 指 同 的 字符 之 前 先 对 p 执行 自 减 运算 。 事 实 上， 下 面 的 两 
个 表达 式 : 


*p++ = val; /* 1% val Fe ABS */ 
val = *eep; /* 将 校 顶 元 素 弹 出 到 val 中 */ 


是 进 校 和 出 校 的 标准 用 法 。 更 详细 的 信息 ， 请 参见 4.3 市 。 头 文件 
<string.h> 中 包含 本 节 提 到 的 函数 的 声明 ， 另 外 还 包括 标准 库 中 其 它 一些 





字符 

串 处 理 函 数 的 声明 。 

练习 53 用 指针 方式 实现 第 2 章 中 的 函数 strat. RŽ strcat(s, t) 
将 t 指 同 的 字符 串 复 制 到 s 指 同 的 字符 串 的 尾部 。 

练习 5.4 编写 函数 strend(s, t)。 如 果 字 符 串 t 出 现在 字符 串 s 的 尾 
部 ， 该 函数 返回 1; 否 则 返回 0。 

练习 5°5 SEEN ee RIAL strncpy. stmeat 和 strncmp， 它 们 最 多 对 参 


数字 符 串 中 


的 前 n 个 字符 进行 操作 。 例 如 ， 函 数 strncpy(st n) 将 t 中 最 多 前 n SH 
符 复 制 到 中 。 更 详细 的 说 明 请 参见 附录 Bo 


练习 5。6 采用 指针 而 非 数 组 索引 方式 改写 前 面 草 节 和 练习 中 的 某 些 程 
序 ， 例 如 getline( 第 1、4 章 )，atoi、itoa 以 及 它们 的 变 体 形式 (第 2、3、 
4 章 )，reverse( 第 3 章 )，strindex、getop( 第 4 章 ) 等 等 。 


5.6 指针 数组 以 及 指 癌 指针 的 指针 


由 于 指针 本 身 也 是 变量 ， 所 以 它们 也 可 以 像 其 它 变量 一 样 存 储 在 数组 
中 。 下 面 通 过 编写 UNIX 程序 sort 的 一 个 简化 版 本 说 明 这 一 点 。 该 程序 
按 字母 顺序 对 由 文本 行 组 成 的 集合 进行 排序 。 


我 们 在 第 3 章 中 曾 描 述 过 一 个 用 于 对 整 型 数组 中 的 元 系 进 行 排序 的 shell 
排序 函数 ， 并 在 第 4 章 中 用 快速 排序 算法 对 它 进 行 了 改进 。 这 些 排序 
算法 在 此 仍然 是 有 效 的， 但 是 ， 现 在 处 理 的 是 长 度 不 一 的 文本 行 。 并 
且 与 整数 不 同 的 是 ， 它 们 不 能 在 单个 运算 中 完成 比较 或 移动 操作 。 我 
们 需要 一 个 能 够 蜗 效 、 方 便 地 处 理 可 变 长 度 文本 行 的 数据 表示 方法 。 
我 们 引入 指针 数组 处 理 这 种 问题 。 如 果 符 排序 的 文本 行 首 尾 相 连 地 存储 
在 一 个 长 字符 数 组 中 ， 那 么 每 个 文本 行 可 通过 指 同 它 的 第 一 个 字符 的 
旨 针 来 访问 。 这 些 指针 本 号 可 以 存储 在 一 个 数组 中 。 这 样 ， 将 指向 两 
个 文本 行 的 指针 传递 给 函数 strcmp 就 可 实现 对 这 两 个 文本 行 的 比较 。 
当 区 换 次 序 颠 倒 的 两 个 文本 行 时 ， 实 际 上 交换 的 是 指针 数组 中 与 这 两 个 
文本 行 相对 应 的 指针 ， 而 不 是 这 两 个 文本 行 本 号 (参见 图 5"8)。 


| defghi P it +| defghi | 
+ jklmnopqrst | i? m an | 
abc -| abc | 


图 5.8 


这 种 实现 方法 消除 了 因 移动 文本 行 本 吴 所 带 来 的 复杂 的 存储 管理 和 巨大 
的 开销 这 两 个 挛 生 问题 。 


排序 过 程 包括 下 列 3 个 步 又 : 


























读 取 所 有 输入 行 对 文本 行进 行 排序 按 次 序 打印 文 本 行 


通常 情况 下 ， 最 好 将 程序 划分 成 大 干 个 与 问题 的 卓然 划分 相 一 致 的 函 
数 ， 并 通过 主 函数 控制 其 它 函 数 的 执行 。 关 于 对 文本 行 排序 这 一 步 ， 
我 们 稍 后 再 做 说 明 ， 现 在 主要 考虑 数据 结构 以 及 输入 和 输出 函数 。 


输入 函数 必须 收集 和 保存 每 个 文本 行 中 的 字符 ， 并 建立 一 个 指 疝 这 些 文 
本 行 的 指针 的 数组 。 它 同时 还 必须 统计 输入 的 行 数 ， 因 为 在 排序 和 打 
印 时 要 用 到 这 一 信息 。 由 于 输入 函数 只 能 处 理 有 限 数目 的 输入 行 ， 所 
以 在 输入 行 数 过 多 而 超过 限定 的 最 大 行 数 时 ， 该 函数 返回 东 个 用 于 表 
示 非 法 行 数 的 数值 ， 例 如 *1。 














输出 函数 只 需要 按照 指针 数组 中 的 次 序 依次 打印 这 些 文本 行 即 可 。 
#include <stdio.h> 
#include <string.h> 


#define MAXLINES 5000 /* max #lines to be sorted */ char 
*lineptr| MAXLINES]; /* pointers to text lines */ int readlines(char 
*lineptr[], int nlines); 


void writelines(char *lineptr[], int nlines); void qsort(char *lineptr[], int left, 
int right); 


/* sort input lines */ main() 
{ 
int nlines; /* number of input lines read */ 


if ((nlines = readlines(lineptr, MAXLINES)) >= 0) { qsort(lineptr, 0, 
nlines¢1); writelines(lineptr, nlines); 


return 0; 

} else { 

printf("error: input too big to sort\n"); return 1; 
} 

} 


#define MAXLEN 1000 /* max length of any input line */ int 
getline(char *, int); 


char *alloc(int); 


/* readlines: read input lines */ 


int readlines(char *lineptr[], int maxlines) 

{ 

int len, nlines; 

char *p, line[MAXLEN]; 

nlines = 0; 

while ((len = getline(line, MAXLEN)) > 0) 

if (nlines >= maxlines || p = alloc(len) == NULL) return «1; 
else { 

line[lene1] = '\0'; /* delete newline */ strcpy(p, line); 
lineptr[nlines++] = p; 

} 

return nlines; 

} 

/* writelines: write output lines */ 

void writelines(char *lineptr[], int nlines) 

{ 

int 1; 


for (i = 0; i < nlines; i++) printf("%s\n", lineptr[i]); 


} 


AREA getline 的 详细 信息 参见 1.9 节 。 在 该 例子 中 ， 指 针 数 组 
lineptr 的 声明 是 新 出 现 的 重要 概念 : 


char *lineptr[MAXLINES]; 

它 表 示 lineptr 是 一 个 具有 MAXLINES 个 元 素 的 一 维 数组 ， 其 中 数组 的 
每 个 元 素 是 一 个 指 问 学 符 类 型 对 象 的 指针 。 也 就 是 说 ， lineptr[i] 是 一 个 
字符 指针 ， 而 *ineptr 叫 是 该 指 针 指 问 的 第 i 个 文本 行 的 首 字 符 。 


由 于 lineptr 本 身 是 一 个 数组 名 ， 因 此 ， 可 按照 前 面 例 子 中 相同 的 方法 
将 其 作为 指针 使 用， 这 样 ，writelines 函数 可 以 改写 为 : 








/* writelines: write output lines */ 
void writelines(char *lineptr[], int nlines) 

{ 

while (nlineses > 0) printf("%s\n", *lineptr++); 
} 

(注意 这 里 的 数组 变量 lineptr 可 以 改变 值 ) 


循环 开始 执行 时 ，*lineptr 指 问 第 一 行 ， 每 执行 一 次 自 增 运算 都 使 得 
lineptr 指 癌 下 一行 ， 同 时 对 nlines 进行 自 减 运算 。 


在 明确 了 输入 和 输出 函数 的 实现 方法 之 后 ， 下 面 便 可 以 着 手 考虑 文本 行 
的 排序 问题 了 。 在 这 里 需要 对 第 4 半 的 快速 排序 函数 做 一 些小 改动 : 首 

先 ， 需 要 修改 该 函数 的 声明 部 分 ;其 次 ， 需 要 调用 strcmp 函数 完成 文本 
行 的 比较 运算 。 但 排序 算法 在 这 里 仍然 有 效 ， 不 需要 做 任何 改动 。 











/* qsort: sort v[left]...v[right] into increasing order */ void qsort(char 
*vy[], int left, int right) 


{ 


int i, last; 
void swap(char *v[], int i, int j); 


if (left >= right) /* do nothing if array contains */ return; /* 
fewer than two elements */ 


swap(V, left, (left + right)/2); last = left; 
for (i = left+1; i <= right; i++) if (stremp(v[i], v[left]) < 0) 


swap(v, ++last, i); swap(v, left, last); qsort(v, left, laste1); qsort(v, last+1, 
right); 


} 

同样 ，swap 函数 也 只 需要 做 一 些 很 小 的 改动 : 

/* swap: interchange v[i] and v[j] */ void swap(char *v[], int i, int j) 
{ 


char *temp; 


temp = vli]; vli] = vlj]; v[j] = temp; 
} 


因为 v( 别 名 为 lineptn) 的 所 有 元 素 都 是 字符 指针 ， 并 且 temp 也 必须 是 字 
从 指针 ， 因 此 


temp 5 v 的 任意 元 素 之 间 可 以 互相 复制 。 


练习 5。7 重 写 函数 readlines， 将 输入 的 文本 行 存储 到 由 main 函数 提供 
的 一 个 数 组 中 ， 而 不 是 存储 到 调用 alloc 分 配 的 存储 空间 中 。 该 函数 的 
运行 速度 比 改 写 前 快 多 少 ? 


5.7 多 维 数 组 


C 语言 提供 了 类 似 于 算 阵 的 多 维 数 组 ， 但 实际 上 它们 并 不 像 指 针 数 组 使 
用 得 那样 广泛 。 本 节 将 对 多 维 数组 的 特性 进行 介绍 。 


我 们 考虑 一 个 日 期 转换 的 问题 ， 把 某 月 某 日 这 种 日 期 表示 形式 转换 为 某 
年 中 第 几 天 的 表 示 形 式 ， 反 之 亦 然 。 例 如 ，3 月 工 日 是 非 周 年 的 第 60 
天 ， 是 国 年 的 第 61 天 。 在 这 里 ， 我 们 定 义 下 列 两 个 函数 以 进行 日 期 转 
换 :函数 day_of year 将 某 月 某 日 的 日 期 表示 形式 转换 为 某 一 年 中 第 几 天 
的 表示 形式 ， 函 数 month_day 则 执行 相反 的 转换 。 因 为 后 一 个 函数 要 返 
回 两 个 值 ， 所 以 在 函数 month_day 中 ， 月 和 日 这 两 个 参数 使 用 指针 的 
形式 。 例 如 ， 下 列 语句 : 


month_day(1988, 60, &m, &d); 
将 把 m 的 值 设 置 为 2， 把 d 的 值 设置 为 29(2 月 29 日 )。 这 些 函 数 都 要 
用 到 一 张 记录 每 月 天 数 的 表 ( 如 “9 月 有 30 天 "等 )。 对 半年 和 非 周年 来 


说 ， 




















每 个 月 的 天 数 不 同 ， 所 以 ， 将 这 些 天 数 分 别 存放 在 一 个 二 维 数组 的 两 行 
中 比 在 计算 过 程 中 判 


2 月 有 多 少 天 更 容易 。 该 数组 以 及 执行 日 期 转换 的 函数 如 下 所 示 : 





static char daytab[2][13] = { 

{0, 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31}, 
{0, 31, 29, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31} 
} 


/* day_of_year: set day of year from month & day */ int 
day_of_year(int year, int month, int day) 


{ 
int i, leap; 


leap = year%4 == 0 && year%100 != 0 || year%400 == 0; for (i = 1; i < 
month; i++) 


day += daytab[leap][i]; return day; 

} 

/* month_day: set month, day from day of year */ 
void month_day(int year, int yearday, int *pmonth, int *pday) 
{ 

int i, leap; 


leap = year%4 == 0 && year%100 != 0 || year%400 == 0; for (i = 1; yearday 
> daytab[leap ][i]; i++) 


yearday *= daytab[leap][il; 


*pmonth = i; 


*pday = yearday; 
} 


RIER WAA AAL, ee IA SU Ne SUE A BY Bee 0( 为 假 
时 ) 或 者 1( 为 真 时 )。 因此 ， 在 本 例 中 ， 可 以 将 逻辑 表达 式 leap 用 做 数组 
daytab 的 下 标 。 


数组 daytab 必须 在 函数 day_of_year 和 month_day 的 外 部 进行 声明 ， 这 
样 ， 这 两 个 函数 都 可 以 使 用 该 数组 。 这 里 之 所 以 将 daytab 的 元 素 声 明 
为 char 是 为 了 说 明 在 char 类 型 的 变量 中 存放 较 小 的 非 字 符 整 数 
也 是 合法 的 。 


到 目前 为 止 ，daytab 是 我 们 过 到 的 第 一 个 二 维 数 组 。 在 C 语言 中 ， 二 维 
数组 实际 上 是 一 种 特殊 的 一 维 数组 ， 它 的 每 个 元 素 也 是 一 个 一 维 数 
组 。 因 此 ， 数 组 下 标 应 该 写成 

















daytab[i][j] /* [row][col] */ 
而 不 能 写成 
daytab[i,j] /* WRONG */ 


除了 表示 方式 的 区 别 外 ，C 语言 中 三 维 数组 的 使 用 方式 和 其 它 语言 一 
样 。 数 组 元 系 按 行 存 储 ， 因此 ， 当 按 存储 顺序 访问 数组 时 ， 最 右边 的 
数组 下 标 ( 即 列 ) 变 化 得 最 快 。 


数组 可 以 用 花 括 号 括 起 来 的 初 值 表 进行 初始 化 ， 二 维 数组 的 每 一 行 由 相 
应 的 子 列 表 进 行 初始 化 。 在 本 例 中 ， 我 们 将 数组 daytab 的 第 一 列 元 素 
设置 为 0， 这 样 ， 月 份 的 值 为 1t12， 而 不 是 0m11。 由 于 在 这 里 存储 空 
nee 所 以 这 种 处 理 方 式 比 在 程序 中 调整 数组 的 下 标 更 
[直观 。 


如 琳 将 二 维 数 组 作为 参数 传递 给 函数 ， 那 么 在 函数 的 参数 声明 中 必须 指 
明 数 组 的 列 数 。 数组 的 行 数 没有 太 大 关系 ， 因 为 前 面 已 经 讲 过 ， 函 数 

调用 时 传递 的 是 一 个 指针 ， 它 指 癌 由 行 向 量 构 成 的 一 维 数 组 ， 其 中 每 

个 行 向 量 是 具有 13 个 整 型 元 素 的 一 维 数 组 。 在 该 例子 中 ， 传 递 











给 函数 的 是 一 个 指向 很 多 对 象 的 指针 ， 其 中 每 个 对 象 是 由 13 个 整 型 元 
素 构成 的 一 维 数 组 。 因 此 ， 如 果 将 数组 daytab 作为 参数 传递 给 函数 f， 
那么 f 的 声明 应 该 写成 下 列 形式 : 

f(int daytab[2][13]) {... } 

也 可 以 写成 

f(int daytab[][13]) { ... } 

因为 数组 的 行 数 无 天 紧要 ， 所 以 ， 该 声明 还 可 以 写成 

f(int (*daytab)[13]) {... } 

这 种 声明 形式 表明 参数 是 一 个 指针 ， 它 指向 具有 13 个 整 型 元 素 的 一 维 
BA. AAT HR SON 优先 级 高 于 * 的 优先 级 ， 所 以 上 述 声 明 中 必须 使 
用 圆 括号 。 如 果 去 掉 括 号 ， 则 声明 变 成 

int *daytab[13] 

这 相当 于 声明 了 一 个 数组 ， 该 数组 有 13 个 元 素 ， 其 中 每 个 元 素 都 是 一 
个 指 回 整 型 对 象 的 指针 。 一 般 来 说 ， 除 数组 的 第 一 维 (下 标 ) 可 以 不 指定 
大 小 外 ， 其 余 各 维 都 必须 明确 指定 大 小 。 

我 们 将 在 5.12 市 中 进一步 讨论 更 复杂 的 声明 。 


练习 598 函数 day_of_year 和 month_day 中 没有 进行 错误 检查 ， 
请 解决 该 问题 。 











5.8 指针 数组 的 初始 化 


考虑 这 样 一 个 问题 :编写 一 个 函数 month_name(n)， 它 返回 一 个 指 问 第 n 
个 月 名 字 的 字符 串 的 指针 。 这 是 内 部 static 类 型 数组 的 一 种 理想 的 应 
用 。month_name 函数 中 包含 一 个 私有 的 字符 串 数 组 ， 当 和 它 被 调用 时 ， 
返回 一 个 指向 正确 元 素 的 指针 。 本 节 将 说 明 如 何 初始 化 该 名 字数 组 。 
旨 针 数组 的 初始 化 语法 和 前 面 所 讲 的 其 它 类 型 对 象 的 初始 化 语法 类 似 : 


/* month_name: return name of neth month */ char *month_name(int 
n) 


{ 

static char *name[] = { "Illegal month", 

"January", "February", "March", 

"April", "May", "June", 

"July", "August", "September", "October", "November", "December" 

}; 

其 中 ，name 的 声明 与 排序 例子 中 lineptr 的 声明 相同 ， 是 一 个 一 维 数 
组 ， 数 组 的 元 素 为 字 符 指 针 。name 数组 的 初始 化 通过 一 个 字符 串 列 表 
实现 ， 列 表 中 的 每 个 字符 串 赋 值 给 数组 相应 位 置 的 元 素 。 第 i 个 学 符 串 
的 所 有 字符 存储 在 存储 器 中 的 某 个 位 置 ， 指 癌 它 的 指针 存储 在 name[j] 
中 。 由 于 上 述 声 明 中 没有 指明 name 的 长 度 ， 因 此 ， 编 译 器 编译 时 将 对 
初 值 个 数 进 行 统计 ， 并 将 这 一 准确 数字 填 入 数组 的 长 度 。 

5.9 指针 与 多 维 数 组 


对 于 C 语言 的 初学 者 来 说 ， 很 容易 混 请 二 维 数组 与 指针 数组 之 间 的 区 
别 ， 比 如 上 面 例子 中 的 name。 假 如 有 下 面 两 个 定义 : 


int a[10][20]; int *b[10]; 








那么 ， 从 语法 角度 讲 ，a[3][4] 和 b[3][4] 都 是 对 一 个 int 对 象 的 合法 引 
用 。 但 a 是 一 个 真正 的 二 维 数组 ， 它 分 配 了 200 个 int 类 型 长 度 的 存储 
空间 ， 并 且 通 过 常规 的 矩阵 下 标 计算 公式 20xrow+col( 其 中 ，row 表示 
ÍT, col 表示 列 ) 计 算得 到 元 素 a[row][col] 的 位 置 。 但 是 ， 对 了 b 来 说 ， 该 
定义 仅仅 分 配 了 10 个 指针 ， 并 且 没 有 对 它们 初始 化 ， 它 们 的 初始 化 必 
须 以 显 式 的 方式 进行 ， 比 如 静态 初始 化 或 通过 代码 初始 化 。 假 定 b 的 
每 个 元 素 都 指向 一 个 具有 20 个 元 RNA, WA SAE MEA EC AC 
200 个 int 类 型 长 度 的 存储 空间 以 及 10 个 指针 的 存储 空间。 指针 数组 的 
一 个 重要 优点 在 于 ， 数 组 的 每 一 行 长 度 可 以 不 同 ， 也 就 是 说 ，b 的 每 个 
元 素 不 必 都 指 问 一 个 具有 20 个 元 素 的 同 量 ， 某 些 元 素 可 以 指 癌 具有 2 
个 元 素 的 同 量 ， 某 些 元 素 可 以 


HARA 50 个 元 系 的 向 量 ， 而 条 些 元 素 可 以 不 指 疝 任何 向量 。 
尽管 我 们 在 上 面 的 讨论 中 都 是 借助 于 整 型 进行 讨论 ， 但 到 目前 为 止 ， 指 
针 数 组 最 频繁 的 用 处 是 存放 具有 不 同 长 度 的 字符 串 ， 比 如 函数 
month_name 中 的 情况 。 结 合 下 面 的 声明 和 图 形 化 描述 ， 我 们 可 以 做 一 
个 比较 。 下 面 是 指针 数组 的 声明 和 图 形 化 描述 (参见 图 5.9): 


char *name[]={"Illegal manth", "Jan", "Feb", "Mar"}; 





























name: 
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图 5.9 
下 面 是 二 维 数组 的 声明 和 图 形 化 描述 (参见 图 5°10): 


char aname[][15] = { "Illegal month", "Jan", "Feb", "Mar" }; 


Tiiegal month\D Jan\0 Feb\o Maro 
图 5°10 
练习 509 FASS ETT SUNS BAB FERD SUS ek AX day_of_year 和 
month_day 。 


5.10 命令 行 参 数 


在 文 持 C 语言 的 环境 中 ， 可 以 在 程序 开始 执行 时 将 命令 行 参 数 传递 给 程 
序 。 调 用 主 函 数 main 时 ， 它 市 有 两 个 参数 。 第 一 个 参数 (习惯 上 称 为 
argc， 用 于 参数 计数 ) 的 值 表 示 运 行 程序 时 命令 行 中 参数 的 数目 ;第 二 个 
参数 ( 称 为 argv， 用 于 参数 向 量 ) 古 一 个 指 癌 字符 串 数组 的 指针 ， 其 中 每 
个 字符 串 对 应 一 个 参数 。 我 们 通常 用 多 级 指针 处 理 这 些 字符 串 。 


最 简单 的 例子 是 程序 echo， 它 将 命令 行 参数 回 显 在 屏幕 上 的 一 行 中 ， 其 
中 命令 行 中 各 参数 之 间 用 空格 阳 开 。 也 就 是 说 ， 命 令 











echo hello, world 
将 打印 下 列 输出 : 


hello, world 





按照 C 语言 的 约定 ，argv[0] 的 值 是 启动 该 程序 的 程序 名 ， 因 此 arge 的 
值 至 少 为 1。 如 果 arge 的 值 为 1， 则 说 明 程 序 名 后 面 没 有 命令 行 参数 。 
在 上 面 的 例子 中 ，argc 的 值 为 3， argv[0]、argv[1] 和 argv[2] 的 值 分 别 
JJ“ echo", “ hello,"， 以 及 “ world"。 第 一 个 可 选 参数 为 argv[1]， 而 
最 后 一 个 可 选 参数 为 argv[argc*1]。 另 外 ，ANSI 标准 要 求 argv[argc] 的 
值 必须 为 一 空 指针 (参见 图 5°11) 


argv: 
e—— echo\o] 
e- hello, \0 | 


— +{world\o 


0 


图 5°11 

程序 echo 的 第 一 个 版 本 将 argv 看 成 是 一 个 字符 指针 数组 : 

#include <stdio.h> 

/* echo commandline arguments; 1st version */ main(int argc, char *argv[]) 
{ 

int 1; 

for (i = 1; i < argc; i++) 

printf("%s%s", argv[i], (i < argce1) ? "" : ""); printf("\n"); 

return 0; 

} 

因为 argv 是 一 个 指向 指针 数组 的 指针 ， 所 以 ， 可 以 通过 指针 而 非 数 组 
下 标的 方式 处 理 命令 行 参数 。echo 程序 的 第 二 个 版 本 是 在 对 argv 进行 
目 增 运算 、 对 arge 进行 目 减 运算 的 基础 上 实现 的 ， 其 中 argv 是 一 个 指 
[A] char 类 型 的 指针 的 指针 : 

#include <stdio.h> 

/* echo commandline arguments; 2nd version */ main(int argc, char *argv[]) 
{ 

while (**argc > 0) 

printf("%s%s", *++argv, (argc > 1) 2?" ":""); printf("\n"); 

return 0; 


} 


因为 argv 是 一 个 指向 参数 字符 串 数 组 起 始 位 置 的 指针 ， 所 以 ， 自 增 运 
算 (++argv) 将 使 得 它 在 最 开始 指 同 argv[1] 而 非 argv[0]。 每 执行 一 次 自 
增 运算 ， 就 使 得 argv 指向 下 一 个 参数，*argv 就 是 指向 那个 参数 的 指 
针 。 与 此 同时 ，argc 执行 自 减 运算 ， 当 它 变 成 0 时， 就 完成 了 所 有 参 
数 的 打印 。 

也 可 以 将 printf 语句 写成 下 列 形式 : 


printf((argc > 1) ? "%s " : "%s”, *++argv); 


这 就 说 明 ，printf 的 格式 化 参数 也 可 以 是 表达 式 。 我 们 来 看 第 二 个 例 
子 。 在 该 例子 中 ， 我 们 将 增强 4.1 节 中 模式 查找 程序 的 功能 。 在 4.1 市 


中 ， 我 们 将 查找 模式 内 置 到 程序 中 了 ， 这 种 解决 方法 显然 不 能 令 人 泪 
意 。 下 面 我 们 来 效仿 UNIX 


程序 grep 的 实现 方法 改写 模式 查找 程序 ， 通 过 命令 行 的 第 一 个 参数 指 
定 符 匹 配 的 模式 。 


#include <stdio.h> 

#include <string.h> 

#define MAXLINE 1000 

int getline(char *line, int max); 


/* find: print lines that match pattern from 1st arg */ main(int argc, 
char *argv[]) 


{ 


char line[ MAXLINE]; 


int found = 0; 

if (argc != 2) 

printf(""Usage: find pattern\n"); else 

while (getline(line, MAXLINE) > 0) 

if (strstr(line, argv[1]) != NULL) { printf("%s", line); 

found++; 

} 

return found; 

} 

标准 库 函 数 strstr(s, 返回 一 个 指针 ， 该 指针 指向 字符 串 { 在 字符 串 s 中 
第 一 次 出 现 的 位 置 ; 如 果 字 符 串 t 没 有 在 字符 串 s 中 出 现 ， 函 数 返 回 
NULL( 空 指针 )。 该 函数 声明 在 头 文 件 <string.h> 中 。 


为 了 更 进一步 地 解释 指针 结构 ， 我 们 来 改进 模式 查找 程序 。 假 定 允 许 程 
序 带 两 个 可 选 参数。 其 中 一 个 参数 表示 a 
行 "， 男 一 个 参数 表示 "每 个 打印 的 文本 行 前 面 加 上 相应 的 行 写 


UNIX 系统 中 的 C 语言 程序 有 一 个 公共 的 约定 :以 负 呈 开头 的 参数 表示 一 
个 可 选 标志 或 参 数 。 假 定 用 。 "x( 代 表 " 除 ..….... 之 外 ' Dead] FU AG 与 模式 
不 匹配 的 文本 行 ， 用 ,mn( 代 表 " 行 号 ") 表 示 打 印行 号 ， 那 么 下 列 命 令 : 


find °x en 模式 将 打印 所 有 与 模式 不 匹配 的 行 ， 并 在 每 个 打印 行 的 前 面 
yi) Wie eee 


可 选 参数 应 该 允许 以 任意 次 序 出 现 ， 同 时 ， 程 序 的 其 余部 分 应 该 与 命令 
行 中 参数 的 数目 无 天 。 此 外 ， 如 果 可 选 参数 能 够 组 合 使 用 ， 将 会 给 使 
用 者 带 来 更 大 的 方便 ， 比 如 : 


find enx 模式 改写 后 的 模式 查找 程序 如 下 所 示 : 











#include <stdio.h> 

#include <string.h> 

#define MAXLINE 1000 

int getline(char *line, int max); 


/* find: print lines that match pattern from 1st arg */ main(int argc, char 
*argvl]) 


{ 

char line[MAXLINE]; long lineno = 0; 

int c, except = 0, number = 0, found = 0; 

while (**argc > 0 && (*++argv)[0] == '*') while (c = *++argv[0]) 
switch (c) { case 'x': 

except = 1; break; 

case n': 


number = 1; 


break; default: 

printf("find: illegal option %c\n", c); argc = 0; 

found = «1; break; 

} 

if (argc != 1) 

printf("Usage: find «x en pattern\n"); else 

while (getline(line, MAXLINE) > 0) { lineno++; 

if ((strstr(line, *argv) != NULL) != except) { if (number) 

printf("%ld:", lineno); 

printf("%s", line); found++; 

} 

} 

return found; 

} 

在 处 理 每 个 可 选 参数 之 前 ，argc 执行 目 减 运算 ，argv ATHER. 
环 语句 结束 时 ， 如 果 没 有 错误 ， 则 arge 的 值 表示 还 没有 处 理 的 参数 数 
目 ， 而 argv 则 指向 这 些 未 处 理 参数 中 的 第 一 个 参数 。 因 此 ， 这 时 arge 
的 值 应 为 1， 而 *argv 应 该 指 问 模式 。 注 意 ，*++argv 是 一 个 指 同 参 数字 
符 串 的 指引 ， 因 此 (*++argv)[0] 是 它 的 第 一 个 字符 ( 另 一 种 有 效 形式 是 
*#++argv)。 因 为 [] 与 操作 数 的 结合 优先 级 比 * 和 ++ 高 ， 所 以 在 上 述 表达 
式 中 必须 使 用 圆 括 号 ， 否 则 编译 器 将 会 P eX ere) 


实际 上 ， 我 们 在 内 层 循环 中 就 使 用 了 表达 式 *++argv[0]， 其 目的 是 遍历 
一 个 特定 的 参数 串 。 在 内 层 循环 中 ， 表 达 式 *++argv[0] 对 指针 argv[0] 进 











行 了 自 增 运算 。 


很 少 有 人 使 用 比 这 更 复杂 的 指针 表达 式 。 如 果 遇 到 这 种 情况 ， 可 以 将 它 
们 分 为 两 步 或 三 步 来 理解 ， 这 样 会 更 直观 一 些 。 


练习 5°10 编写 程序 exgpr， 以 计算 从 命令 行 输入 的 逆 波兰 表达 式 
的 值 ， 其 中 每 个 运算 符 或 操作 数 用 一 个 单独 的 参数 表示 。 例 如 ， 命 令 


expr234+* 
将 计算 表达 式 x (3+4) 的 值 。 
练习 5°11 修改 程序 entab 和 decab( 第 1 章 练习 中 编写 的 函数 )， 


使 它们 接受 一 组 作 为 参数 的 制 表 符 停 止 位 。 如 果 局 动 程序 时 不 带 参 
数 ， 则 使 用 默认 的 制 表 符 停止 位 设置 。 


练习 5°12 对 程序 entab 和 detab 的 功能 做 一 些 扩 充 ， 以 接受 下 列 


缩写 的 命令 : 

entab —m +n 

表示 制 表 符 从 第 m 列 开始 ， 每 隔 n 列 停止 。 选 择 (对 使 用 者 而 言 ) 比 较 方 
便 的 默认 行为 。 练习 5.13 ”编写 程序 tail， 将 其 输入 中 的 最 后 nm 行 
打印 出 来 。 默 认 情 况 下 ，n 的 值 为 

10， 但 可 通过 一 个 可 选 参 数 改变 n 的 值 ， 因 此 ， 命 令 


tail en 


将 打印 其 输入 的 最 后 n 行 。 无 论 输入 或 n 的 值 是 否 合理 ， 该 程序 都 应 该 
能 正常 运行 。 编 








写 的 程序 要 充分 地 利用 存储 空间 ;输入 行 的 存储 方式 应 该 同 5.6 市 中 排 
序 程序 的 存储 方式 一 样 ， 而 不 采用 固定 长 度 的 二 维 数组 。 


5.11 指 问 函数 的 指针 


在 C 语言 中 ， 函 数 本 身 不 是 变量 ,但 可 以 定义 指向 函数 的 指针 。 这 种 类 
型 的 指针 可 以 被 赋值 、 存 放 在 数组 中 、 传 递 给 函数 以 及 作为 函数 的 返 
回 值 等 等 。 为 了 说 明 指 疝 函 数 的 指针 的 用 法 ， 我 们 接 下 来 将 修改 本 章 
前 面 的 排序 函数 ， 在 给 定 可 选 参数 "n 的 情况 下 ， 该 函数 将 按 数 值 大 小 
而 非 字 典 顺 序 对 输入 行进 行 排序 。 


排序 程序 通常 包括 3 部 分 :判断 任何 两 个 对 象 之 间 次 序 的 比较 操作 、 颠 
倒 对 象 次 序 的 交 换 操作 、 一 个 用 于 比较 和 交换 对 象 直到 所 有 对 象 都 按 
正确 次 序 排列 的 排序 算法 。 由 于 排序 算 法 与 比较 、 交 换 操作 无 天 ， 
此 ， 通 过 在 排序 算法 中 调用 不 同 的 比较 和 交换 函数 ， 便 可 以 实 现 按照 
不 同 的 标准 排序 。 这 惑 是 我 们 的 新 版 本 排序 函数 所 采用 的 方法 。 


我 们 在 前 面 讲 过 ， 函 数 strcmp 按 字 典 顺 序 比较 两 个 输入 行 。 在 这 里 ， 
我 们 还 需要 一 个 以 数值 为 基础 来 比较 两 个 输入 行 ， 并 返回 与 strcmp 同 
样 的 比较 结果 的 函数 numcmp。 这 些 函 数 在 main 之 前 声明 ， 并 且 ， 指 
向 恰当 函数 的 指针 将 被 传递 给 qsort 函数 。 在 这 里 ， 参 数 的 出 错 处 理 并 
不 是 问题 的 重点 ， 我 们 将 主要 考虑 指 问 函数 的 指针 问题 。 


#include <stdio.h> 


























#include <string.h> 


#define MAXLINES 5000 /* max #lines to be sorted */ char 
*lineptr|. MAXLINES]; /* pointers to text lines */ 


int readlines(char *lineptr[], int nlines); void writelines(char *lineptr[], int 
nlines); 


void qsort(void *lineptr[], int left, int right, int (*comp)(void *, void *)); 


int numcmp(char *, char *); 


/* sort input lines */ main(int argc, char *argv[]) 
{ 


int nlines; /* number of input lines read */ int numeric = 0; /* 
1 if numeric sort */ 


if (argc > 1 && strcmp(argv[1], "en") == 0) numeric = 1; 


if ((nlines = readlines(lineptr, MAXLINES)) >= 0) { qsort((void**) lineptr, 0, 
nlinese1, 


(int (*)(void*,void*))(numeric ? numcmp : strcmp)); writelines(lineptr, 
nlines); 


return 0; 

} else { 

printf("input too big to sort\n"); return 1; 
} 

} 


在 调用 函数 qsort 的 语句 中 ，strcmp 和 numcmp 是 函数 的 地 址 。 因 为 它 
们 是 函数 ， 所 


以 前 面 不 需要 加 上 取 地 址 运算 符 &， 同 样 的 原因 ， 数 组 名 前 面 也 不 需要 
& 运 算 符 。 


改写 后 的 qsort 函数 能 够 处 理 任 何 数据 类 型 ， 而 不 仅仅 限于 字符 串 。 从 
函数 qsort 的 原型 可 以 看 出 ， 它 的 参数 表 包 括 一 个 指针 数组 、 两 个 整数 
和 一 个 有 两 个 指针 参数 的 函数 。 其 中 ， 指 针 数组 参数 的 类 型 为 通用 指 
针 类 型 void * 。 由 于 任何 类 型 的 指针 都 可 以 转换 为 void 


* 类 型 ， 并 且 在 将 它 转换 回 原 来 的 类 型 时 不 会 丢失 信息 ， 所 以 ， 调 用 
qsort 函数 时 可 以 将 参 数 强 制 转换 为 void * 类 型 。 比 较 函 数 的 参数 也 要 
执行 这 种 类 型 的 转换 。 这 种 转换 通常 不 会 影 啊 到 数据 的 实际 表示 ， 但 
要 确保 编译 器 不 会 报错 。 








/* qsort: sort v[left]...v[right] into increasing order */ void qsort(void 
*vy[], int left, int right, 


int (*comp)(void *, void *)) 
{ 

int i, last; 

void swap(void *v[], int, int); 


if (left >= right) /* do nothing if array contains */ 
return; /* fewer than two elements */ 


swap(v, left, (left + right)/2); last = left; 

for (i = left+1; i <= right; i++) if ((*comp)(v[i], v[left]) < 0) 
swap(v, ++last, i); swap(v, left, last); 

qsort(v, left, laste1, comp); qsort(v, last+1, right, comp); 

} 

我 们 仔细 研究 一 下 其 中 的 声明 。qsort 函数 的 第 四 个 参数 声明 如 下 : 


int (*comp)(void *, void *) 


它 表 明 comp 是 一 个 指 疝 函数 的 指针 ， 该 函数 具有 两 个 void * 类 型 的 参 
数 ， 其 返回 值 类 型 为 int。 


在 下 列 语句 中 : 
if ((*comp)(v[i], vlleft]) < 0) 


comp 的 使 用 和 其 声明 是 一 致 的 ，comp 是 一 个 指向 函数 的 指针 ，*comp 
代表 一 个 函数 。 下 列 语句 是 对 该 函数 进行 调用 : 


(*comp)(v[i], v[left]) 


其 中 的 圆 括号 是 必须 的 ， 这 样 才能 够 保证 其 中 的 各 个 部 分 正确 结合 。 如 
果 没 有 括号 ， 例 如 写 成 下 面 的 形式 : 


int *comp(void *, void *) /* WRONG */ 


则 表明 comp 是 一 个 函数 ， 该 函数 返回 一 个 指 问 int 类 型 的 指针 ， 这 同 
我 们 的 本 意 显 然 有 很 KWA 

我 们 在 前 面 讲 过 函数 strcmp， 占 用 于 比较 两 个 字符 串 。 这 里 介绍 的 函数 
numcmp 也 是 比 较 两 个 字符 串 ， 但 它 通 过 调用 atof 计算 字符 串 对 应 的 数 
值 ， 然 后 在 此 其 础 上 进行 比较 : 


#include <stdlib.h> 





/* numcmp: compare s1 and s2 numerically */ int numcmp(char *s1, 
char *s2) 


{ 

double v1, v2; 

v1 = atof(s1); v2 = atof(s2); if (v1 < v2) 
return °1; else if (v1 > v2) 

return 1; else 

return 0; 

} 


交换 两 个 指引 的 swap 函数 和 本 章 前 面 所 述 的 swap 函数 相同 ， 但 它 的 参 
数 声明 为 void * 


类 型 。 

void swap(void *v[], int i, int j;) 

{ 

void *temp; 

temp = vlil; vli] = vlj]; vlj] = temp; 

} 

还 可 以 将 其 它 一 些 选 页 增加 到 排序 程序 中 ， 有 些 可 以 作为 较 难 的 练习 。 


练习 5°14 修改 排序 程序 ， 使 它 能 处 理 *r 标记 。 该 标记 表明 ， 以 逆序 ( 递 
减 ) 方 式 排序 。 要 保证 Men 能 够 组 合 在 一 起 使 用 。 


练习 5°15 增加 选 页 f， 使 得 排序 过 程 不 考虑 字母 大 小 写 之 间 的 区 














别 。 例 如 ， 比 较 a 
和 A 时 认为 它们 相等 。 


练习 5°16 增加 选 页 *d( 代 表 目 录 顺 序 )。 该 选 页 表明 ， 只 对 字母 、 数 字 和 
空格 进行 比 较 。 要 保证 该 选 页 可 以 和 of 组 合 在 一 起 使 用 。 


练习 5017 增加 字段 处 理 功 能 ， 以 使 得 排序 程序 可 以 根据 行内 的 不 同 字 
段 进行 排序 ， 每 个 字段 按照 一 个 单独 的 选 页 集合 进行 排序 。( 在 对 本 书 
ae ee en eae Nea ae 
选 页 。) 


5.12 复杂 声明 


C 语言 第 第 因为 声明 的 语法 问题 而 受到 人 人 们 的 批评 ， 特 别 是 涉及 到 函数 
指针 的 语法 。C 语 言 的 语法 力图 使 声明 和 使 用 相 一 致 。 对 于 简单 的 情 
况 ，C 语言 的 做 法 是 很 有 效 的 ， 但 是 ， 如 果 情况 比较 复杂 ， 则 容易 让 人 
混 消 ， 原 因 在 于 ，C 语言 的 声明 不 能 从 左 至 右 阅 读 ， 而 且 使 用 了 太 多 的 
同 括 号。 我 们 来 看 下 面 所 示 的 两 个 声明 : 


























int *f(); /* f: function returning pointer to int */ 
gP 


以 及 


int (*pf)Q; /* pf: pointer to function returning int */ 


它们 之 间 的 含义 差别 说 明 :* 古 一 个 前 级 运算 符 ， 其 优先 级 低 于 ()， 所 
以 ， 声 明 中 必须 使 用 圆 括号 以 保 正 确 的 结合 顺序 。 


尽管 实际 中 很 少 用 到 过 于 复杂 的 声明 ， 但 是 ， 划 得 如 何 理解 甚至 如 何 使 
用 这 些 复杂 的 声 明 是 很 重要 的 。 如 何 创建 复杂 的 声明 昵 ?一 种 比较 好 的 
方法 是 ， 使 用 typedef 通过 简单 的 步 又 合 成 ， 这 种 方法 我 们 将 在 6.7 市 

中 讨论 。 这 里 介绍 男 一 种 方法 。 接 下 来 讲述 的 两 个 程序 就 使 用 这 种 方 

法 :一 个 程序 用 于 将 正确 的 C 语言 声明 转换 为 文字 描述 ， 为 一 个 程 友 完 

成 相反 的 转 换 。 文 字 描 述 是 从 磊 至 右 阅读 的 。 


第 一 个 程序 del 复杂 一 些 。 它 将 C 语言 的 声明 转换 为 文字 描述 ， 比 如 : 








char **argv 


argv: pointer to char int (*daytab)[13] 
daytab: pointer to array[13] of int int *daytab[13] 
daytab: array[13] of pointer to int void *comp() 


comp: function returning pointer to void void (*comp)() 

comp: pointer to function returning void char (*(*xQ)[)Q 

x: function returning pointer to array[] of pointer to function returning char 
char (*(*x[3])O)[5] 

x: array[3] of pointer to function returning pointer to array[5] of char 


程序 del 是 基于 声明 符 的 语法 编写 的 。 附 录 A 以 及 8.5 节 将 对 声明 符 的 
语法 进行 详细 的 描述 。 下 面 是 其 简化 的 语法 形式 : 


dcl: optional *'s directedcl directedcl name 


(dcl) directsdcl() 


directedcl[optional size] 


简 而 言 之 ， 声 明 符 dcl 就 是 前 面 可 能 带 有 多 个 * 的 directedcl. directedcl 
可 以 是 name、 由 一 对 圆 括号 括 起 来 的 dcl、 后 面 跟 有 一 对 圆 括号 的 
direct*dcl、 后 面 跟 有 用 方 括号 括 起 来 的 表示 可 选 长 度 的 direct*dcl。 


该 语法 可 用 来 对 C 语言 的 声明 进行 分 析 。 例 如 ， 考 虑 下 面 的 声明 符 : 
(*pfa[])() 


按照 该 语法 分 析 ，pfa 将 被 识别 为 一 个 name， 从 而 被 认为 是 一 个 
direct*dcl。 于 是 ，pfa[] 也 是 一 个 direct*dcl。 接 着 ，*pfa[] 被 识别 为 一 个 
dcl， 因 此 ， 判 定 (*pfa[]) 是 一 个 directdcl。 再 接着 ，(*pfaD)O 被 识别 为 
一 个 direct*dcl， 因 此 也 是 一 个 dcl。 可 以 用 图 5°12 所 示 的 语法 分 析 树 来 
说 明 分 析 的 过 程 (其 中 direct*dcl 缩写 为 dir*dcl)。 





f + pfa 口 2 Q 


name H 
dir-del 


dir-del 
del 

dir-del 

dir-del 


dci 


图 5°12 


程序 del 的 核心 是 两 个 函数 :dcl 与 dirdcl， 它 们 根据 声明 符 的 语法 对 声明 
进行 分 析 。 因为 语法 是 递归 定义 的 ， 所 以 在 识别 一 个 声明 的 组 成 部 分 
时 ， 这 两 个 函数 是 相互 递归 调用 的 。 我 们 称 该 程序 是 一 个 递归 下 降 语 
法 分 析 程 序 。 





/* dcl: parse a declarator */ void dcl(void) 
{ 

int ns; 

for (ns = 0; gettoken() == '*'; ) /* count *'s */ ns++; 
dirdcl(); 

while (nsee > 0) 


strcat(out, " pointer to"); 


} 


/* dirdcl: parse a direct declarator */ void dirdcl(void) 
{ 

int type; 

if (tokentype == '(’) { /* ( dcl ) */ dcelQ; 


if (tokentype !=')') printf("error: missing )\n"); 


} else if (tokentype == NAME) /* variable name */ strcpy(name, 
token); 


else 
printf("error: expected name or (dcl)\n"); 


while ((type=gettoken()) == PARENS || type == BRACKETS) if (type == 
PARENS) 


strcat(out, " function returning"); 


else { 

strcat(out, " array"); strcat(out, token); strcat(out, " of"); 

} 

} 

该 程序 的 目的 旨 在 说 明 问题 ， 并 不 想 做 得 尽善尽美 ， 所 以 对 dd 有 很 多 
限制 ， 它 只 能 处 理 类 似 于 char 或 int 这 样 的 简单 数据 类 型 ， 而 无 法 处 理 
函数 中 的 参数 类 型 或 类 似 于 const 这 样 的 限定 符 。 它 不 能 处 理 带 有 不 必 
要 空格 的 情况 。 由 于 没有 完备 的 出 错 处 理 ， 因 此 它 也 无 法 处 理 无 效 的 
声明 。 这 些 方面 的 改进 留 给 读者 做 练习 。 

下 面 是 该 程序 的 全 局 变量 和 主 程序 : 


#include <stdio.h> 








#include <string.h> 

#include <ctype.h> 

#define MAXTOKEN 100 

enum { NAME, PARENS, BRACKETS }; 
void dcl(void); void dirdcl(void); 

int gettoken(void); 


int tokentype; /* type of last token */ char token[MAXTOKEN]; /* last 
token string */ char name[MAXTOKEN]; /* identifier name */ 


char datatype[/ MAXTOKEN]; /* data type = char, int, etc. */ char out[ 1000]; 
main() /* convert declaration to words */ 


{ 


while (gettoken() != EOF) { /* 1st token on line */ strcpy(datatype, 
token); /* is the datatype */ out[0] = '\0'; 


dclQ); /* parse rest of line */ if (tokentype != ^n’) 
printf("‘syntax error\n"); 

printf("%s: %s %s\n", name, out, datatype); 

} 

return 0; 

} 

函数 gettoken 用 来 跳 过 空格 与 制 表 符 ， 以 查找 输入 中 的 下 一 个 记 
写 。" 记 号 "(token) 可 以 是 一 个 名 字 ， 一 对 圆 括 写 ， 可 能 包含 一 个 数字 的 
一 对 方 括号 ， 也 可 以 是 其 它 任 何 单个 字 符 。 

int gettoken(void) /* return next token */ 

{ 

int c, getch(void); void ungetch(int); char *p = token; 


while ((c = getch()) =="' || c == t) 


if (c=="() { 

if ((c = getch()) ==")) { 

strcpy(token, "()"); return tokentype = PARENS; 
} else { 

ungetch(c); 

return tokentype = '(’; 

} 

} else if (c == T) { 

for (*p++ = c; (*p++ = getch()) != T; ) 
*p = '\0'; 

return tokentype = BRACKETS; 

} else if (isalpha(c)) { 

for (*p++ = c; isalnum(c = getch()); ) 
*p++ = C; 

*p = '\0'; ungetch(c); 

return tokentype = NAME; 

} else 

return tokentype = c; 


} 


有 关 函 数 getch 和 ungetch 的 说 明 ， 参 见 第 4 章 。 如 果 不 在 乎 生成 多 余 
的 圆 括号 ， 另 一 个 方 回 的 转换 要 容易 一 些 。 为 了 简化 程序 的 输入 ， 





我 们 将 “ x is a function returning a pointer to an array of pointers to functions 
returning char"(x 是 


一 个 函数 ， 它 返回 一 个 指针 ， 该 指针 指 同 一 个 一 维 数组 ， 访 一 维 数组 的 
元 素 为 指针 ， 这 些 指 针 分 别 指 同 多 个 函数 ， 这 些 函 数 的 返回 值 为 char 
类 型 ) 的 描述 用 下 列 形式 表示 : 

x Q * [] * Q char 

程序 undcl 将 把 该 形式 转换 为 : 

char (*(*xQ)LDO 


由 于 对 输入 的 语法 进行 了 简化 ， 所 以 可 以 重用 上 面 定 义 的 gettoken ek 
数 。undcl 和 del 


使 用 相同 的 外 部 变量 。 


/* undcl: convert word descriptions to declarations */ main() 
{ 

int type; 

char ttmp[MAXTOKEN]; 


while (gettoken() != EOF) { strcpy(out, token); 

while ((type = gettoken()) != '\n’) 

if (type == PARENS || type == BRACKETS) strcat(out, token); 
else if (type == '*') { sprintf(temp, "(*%s)", out); strcpy(out, temp); 


} else if (type == NAME) { sprintf(temp, "%s %s", token, out); strcpy(out, 
temp); 


} else 


} 


return 0; 


} 
printf("invalid input at %s\n", token); 


练习 5°18 修改 del 程序 ， 使 它 能 够 处 理 输入 中 的 错误 。 


练习 5°19 修改 undcl 程序 ， 使 它 在 把 文字 描述 转换 为 声明 的 过 程 
中 不 会 生成 多 余 的 圆 括 写 。 
练习 5°20 扩展 del 程序 的 功能 ， 使 它 能 够 处 理 包 含 其 它 成 分 的 声 


明 ， 例 如 带 有 函数 参数 类 型 的 声明 、 带 有 类 似 于 const 限定 符 的 声明 
等 。 


SOE 结构 


结构 是 一 个 或 多 个 变量 的 集合 ， 这 些 变量 可 能 为 不 同 的 类 型 ， 为 了 处 理 
的 方便 而 将 这 些 变量 组 织 在 一 个 名 字 之 下 。( 某 些 语言 将 结构 称 为 " 记 

录 "， 比 如 Pascal 语言 。) 由 于 结构 将 一 组 相关 的 变量 看 作 一 个 单元 而 不 
re eee alee ee nc rar IO Ne 

J 程序 中 。 


工资 记录 是 用 来 描述 结构 的 一 个 传统 例子 。 每 个 雇员 由 一 组 属性 描述 ， 
如 姓名 、 地 址 、 社 会 保险 号 、 工 资 等 。 其 中 的 茶 些 属性 也 可 以 是 结 
构 ， 例 如 姓名 可 以 分 成 几 部 分 ， 地 址 甚至 工资 也 可 能 出 现 类 似 的 情 
况 。C 语言 中 更 典型 的 一 个 例子 来 目 于 图 形 领域 : 氮 由 一 对 坐标 定义 ， 
矩形 由 两 个 点 定 义 ， 等 等 。 


ANSI 标准 在 结构 方面 最 主要 的 变化 是 定义 了 结构 的 赋值 操作 一 一 结构 
可 以 拷贝 、 赋 值 、 传 递 给 函数 ， 函 数 也 可 以 返回 结构 类 型 的 返回 值 。 
多 年 以 前 ， 这 一 操作 就 已 经 个 大 多 数 的 编 译 器 所 文 持 ， 但 是 ， 直 到 这 
一 标准 才 对 其 属性 进行 了 精确 定义 。 在 ANSI 标准 中 ， 自 动 结构 和 数组 
现在 也 可 以 进行 初始 化 。 


6.1 结构 的 基本 知识 


我 们 首先 来 建立 一 些 适 用 于 图 形 领 域 的 结构 。 点 是 最 基本 的 对 象 ， 假 定 
H x Sy tre RE, Hx y 的 坐标 值 都 为 整数 (参见 图 6*1) 
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图 6.1 
我 们 可 以 采用 结构 存放 这 两 个 坐标 ， 其 声明 如 下 : 


struct point { int x; 

int y; 

}; 

关键 字 struct 引入 结构 声明 。 结 构 声 明 由 包含 在 花 括号 内 的 一 系列 声明 
组 成 。 关 键 字 struct 后 面 的 名 字 是 可 选 的 ， 称 为 结构 标记 (这 里 是 
poinbD。 结 构 标 记 用 于 为 结构 命名 ， 在 定义 之 后 ， 结 构 标 记 就 代表 人 花 括 
号 内 的 声明 ， 可 以 用 它 作 为 该 声明 的 简写 形式 。 


结构 中 定义 的 变量 称 为 成 员 。 结 构成 员 、 结 构 标 记 和 普通 变量 ( 即 非 成 
员 ) 可 以 采用 相 














NAF, EMAAR, BASE Por ire By aE TET 
区 分 。 另 外 ， 不 同 结 构 中 的 成 员 可 以 使 用 相同 的 名 字 ， 但 是 ， 从 编程 
风格 方面 来 说 ， 通 党 只 有 密切 相关 的 对 象 才 会 使 用 相同 的 名 字 。 


struct 声明 定义 了 一 种 数据 类 型 。 在 标志 结构 成 员 表 结束 的 右 花 括号 之 
后 可 以 跟 一 个 变 量 表 ， 这 与 其 它 基 本 类 型 的 变量 声明 是 相同 的 。 例 如 : 

















struct { ... } X, Y, Z; 


从 语法 角度 来 说 ， 这 种 方式 的 声明 与 声明 





int x, y, Z; 


具有 类 似 的 意义 。 这 两 个 声明 都 将 X、y 与 z 声明 为 指定 类 型 的 变量 ， 
并 且 为 它们 分 配 存储 空 间 。 


如 琳 结构 声明 的 后 面 不 带 变 量 表 ， 则 不 需要 为 它 分 配 存储 空间 ， 它 仅仅 
描述 了 一 个 结构 的 模板 或 轮廓 。 但 是 ， 如 果 结 构 声 明 中 带 有 标记 ， 那 
么 在 以 后 定义 结构 实例 时 便 可 以 使 用 该 标记 定义 。 例 如 ， 对 于 上 面 给 
出 的 结构 声明 point， 语 句 








struct point pt; 


定义 了 一 个 struct point 类 型 的 变量 pt。 结 构 的 初始 化 可 以 在 定义 的 后 面 
io 行 。 初 值 表 中 同 每 个 成 员 对 应 的 初 值 必须 是 常量 表达 
aa ’ il H: 


struct point maxpt = {320, 200}; 

自动 结构 也 可 以 通过 赋值 初始 化 ， 还 可 以 通过 调用 返回 相应 类 型 结构 的 
函数 进行 初始 化 。 在 表达 式 中 ， 可 以 通过 下 列 形式 引用 茶 个 特定 结构 
中 的 成 员 : 

结构 名 .成 员 


其 中 的 结构 成 员 运 算 符 “." 将 结构 名 与 成 员 名 连接 起 来 。 例 如 ， 可 用 下 
列 语句 打印 点 pt 的 坐标 : 











printf("%d,%d", pt.x, pt.y); 

或 者 通过 下 列 代码 计算 原点 (0, 0) 到 点 pt 的 距离 : 
double dist, sqrt(double); 

dist = sqrt((double)pt.x * pt.x + (double)pt.y * pt.y); 


ZR AT ARE. FRAT AT DAF A 2 ES ORE HI (EL 
6.2)， 相 应 的 结构 定 义 如 下 : 








struct rect { 

struct point pt1; struct point pt2; 

}; 

结构 rect 包含 两 个 point 类 型 的 成 员 。 如 末 控 照 下 列 方式 声明 screen 变 
HE: 

struct rect screen; 

则 可 以 用 语句 

screen.pt1.x 


引用 screen 的 成 员 ptl 的 x 坐标 。 
6.2 结构 与 函数 


结构 的 合法 操作 只 有 几 种 :作为 一 个 整体 复制 和 赋值 ， 通 过 & 运算 符 取 地 
址 ， 访 问 其 成 员 。 其 中 ， 复 制 和 赋值 包括 疝 函 数 传递 参数 以 及 从 函数 
返回 值 。 结 构 之 间 不 可 以 进行 比较 。 可 以 用 一 个 常量 成 员 值 列表 初始 
化 结构 ， 目 动 结构 也 可 以 通过 赋值 进行 初始 化 。 


为 了 更 进一步 地 理解 结构 ， 我 们 编写 几 个 对 点 和 和 卸 形 进行 操作 的 函数 。 
至 少 可 以 通过 3 种 可 能 的 方法 传递 结构 :一 是 分 别传 递 各 个 结构 成 员 ， 
eee Ta » Sets la 构 的 指针 。 这 3 种 方法 各 有 利 


Pan 


首先 来 看 一 下 函数 makepoint， 它 带 有 两 个 整 型 参数 ， 并 返回 一 个 point 
类 型 的 结构 : 





/* makepoint: make a point from x and y components */ struct point 
makepoint(int x, int y) 


{ 


struct point temp; 


temp.x = x; temp.y = y; return temp; 

} 

注意 ， 参 数 名 和 结构 成 员 同 名 不 会 引起 冲突 。 事 实 上 ， eae 
调 两 者 之 间 的 关系 。 现在 可 以 使 用 makepoint 函数 动态 地 初始 化 任意 纤 
构 ， 也 可 以 问 函数 提供 结构 类 型 的 参 


数 。 例 如 : 





struct rect screen; struct point middle; 

struct point makepoint(int, int); 

screen.ptl = makepoint(0,0); screen.pt2 = makepoint(XMAX, YMAX); 
middle = makepoint((Screen.pt1.X + screen.pt2.x)/2, 

(screen.ptl.y + screen.pt2.y)/2); 

接 下 来 需要 编写 一 系列 的 函数 对 点 执行 算术 运算 。 例 如 : 








/* addpoints: add two points */ 
struct addpoint(struct point p1, struct point p2) 


{ 


p1.x += p2.x; pl.y += p2.y; return p1; 

} 

其 中 ， 函 数 的 参数 和 返回 值 都 是 结构 类 型 。 之 所 以 直接 将 相 加 所 得 的 结 
RES pl, MEA 使 用 显 式 的 临时 变量 存储 ， 是 为 了 强调 结构 类 型 
的 参数 和 其 它 类 型 的 参数 一 样 ， 都 是 通过 值 传递 的 。 

下 面 来 看 另外 一 个 例子 。 函 数 prinrect 判断 一 个 点 是 否 在 给 定 的 矩形 内 


部 。 我 们 采用 这 样 一 个 约定 :矩形 包括 其 左 侧 边 和 底 边 ， 但 不 包括 顶 边 
和 右 侧 边 。 








/* ptinrect: return 1 if p in r, 0 if not */ int ptinrect(struct point p, 
struct rect r) 


{ 

return p.x >= r.ptl.x && p.x < r.pt2.x 
&& p.y >=r.ptl.y && p.y < r.pt2.y; 

} 


这 里 假设 矩形 是 用 标准 形式 表示 的 ， 其 中 ptt 的 坐标 小 于 pt2 的 坐标 。 
下 列 函 数 将 返回 一 个 规范 形式 的 矩形 : 


#define min(a, b) ((a) < (b) ? (a) : (b)) 
#define max(a, b) ((a) > (b) ? (a) : (b)) 


/* canonrect: canonicalize coordinates of rectangle */ struct rect 
canonrect(struct rect r) 


| 
struct rect temp; 


temp.ptl.x = min(r.pt1.x, r.pt2.x); 


temp.ptl.y = min(r.pt1.y, r.pt2.y); 

temp.pt2.x = max(r.pt1.x, r.pt2.x); 

temp.pt2.y = max(r.pt1.y, r.pt2.y); return temp; 
} 


如 果 传 递 给 函数 的 结构 很 大 ， 使 用 指针 方式 的 效率 通常 比 复制 整个 结构 
的 效率 要 高 。 结 构 指 针 类 似 于 普通 变量 指针 。 声 明 


struct point *pp; 

将 pp 定义 为 一 个 指向 struct point 类 型 对 象 的 指针 。 如 果 pp 指向 一 个 
point 结构 ， 那 A*pp 即 为 该 结构 ， 而 (*pp).x 和 (*pp).y 则 是 结构 成 员 。 
可 以 按照 下 例 中 的 方式 使 用 pp: 

struct point origin, *pp; 

pp = &origin; 

printf("origin is (%d,%d)\n", (*pp).x, (*pp).y); 

其 中 ，(*pp).x 中 的 圆 括号 是 必需 的 ， 因 为 结构 成 员 运 算 符 “”." 的 优先 级 
比 。*" 的 优先 级 高 。 表 达 式 *pp.x 的 含义 等 价 于 *(pp.x)， 因 为 x 不 是 指 
针 ， 所 以 该 表达 式 是 非法 的 。 


结构 指针 的 使 用 频 度 非常 高 ， 为 了 使 用 方便 ，C 语言 提供 了 为 一 种 简写 
方式 。 假 定 p 是 一 个 指向 结构 的 指针 ， 可 以 用 


p"> 结 构成 员 





e 这 样 ， 就 可 以 用 下 面 的 形式 改写 上 面 的 
{TARI 


printf("origin is (%d,%d)\n", pp*>x, pp*>y); 运算 符 . 和 。> 都 是 从 左 至 右 结 合 
的 ， 所 以 ， 对 于 下 面 的 声明 : struct rect r, *rp = &r; 


LAR 4 BIASES TN: 

r.pt1.x rpe>pt1.x (r.pt1).x (rp*>pt1).x 

在 所 有 运算 符 中 ， 下 面 4 个 运算 符 的 优先 级 最 高 :结构 运算 符 “." 和 “ 
>". APRA 调用 的 “QO" 以 及 用 于 下 标的 “[]"， 因 此 ， 它 们 同 操作 数 之 
间 的 结合 也 最 紧密 。 例 如 ， 对 于 结构 声明 

struct { 

int len; char *str; 

} *p; 

表达 式 

++pe>len 

将 增加 len 的 值 ， 而 不 是 增加 p 的 值 ， 这 是 田 为 ， 其 中 的 隐 含 括号 关系 
是 ++(p*>len)。 可 以 使 用 括号 改变 结合 次 序 。 例 如 :(++p)*>len 将 先 执行 
p 的 加 1 操作， 再 对 len 执行 操作 ; 而 (p++)*>len 则 先 对 len 执行 操作 ， 
然后 再 将 p 加 1( 该 表达 式 中 的 括号 可 以 省 略 )。 

同样 的 道理 ，*p。>str 读 取 的 是 指针 str 所 指向 的 对 象 的 值 ;*p*>str++ 先 读 
取 指 针 str 指向 的 对 象 的 值 ， 然 后 再 将 str 加 1( 与 *s++ 相 同 ); 


(*p*>str)++ 将 指针 str Talal 的 对 象 的 值 加 1;*p++。>str 先 读 取 指 针 str 指 
加 的 对 象 的 值 ， 然 后 再 将 p 加 1。 


6.3 结构 数组 
考虑 编写 这 样 一 个 程序 ， 它 用 来 统计 输入 中 各 个 C 语言 关键 字 出 现 的 次 


数 。 我 们 需要 用 一 个 字符 串 数组 存放 关键 字 名 ， 一 个 整 型 数组 存放 相 
应 关键 字 的 出 现 次 数 。 一 种 实现 方法 是 ， 使 用 两 个 独立 的 数组 keyword 
和 keycount 分 别 存放 它们 ， 如 下 所 示 


char *keyword[NKEYS]; int keycountLNKEYS]; 


我 们 注意 到 ， 这 两 个 数组 的 大 小 相同 ， 考 虑 到 该 特点 ， 可 以 采用 另 一 种 
人 
舌 一 对 变量 : 





char *word; int cout; 


这 样 的 多 个 变量 对 共同 构成 一 个 数组 。 我 们 来 看 下 面 的 声明 : 





struct key { char *word; int count; 


} keytabL[NKEYS]; 


它 声 明了 一 个 结构 类 型 key， 并 定义 了 该 类 型 的 结构 数组 keytab, [AJAY 
为 其 分 配 存 储 空 间 。 数组 keytab 的 每 个 元 素 都 是 一 个 结构 。 上 述 声明 
也 可 以 写成 下 列 形式 : 





struct key { char *word; int count; 

} 

struct key keytab[NKEYS]; 

因为 结构 keytab 包含 一 个 固定 的 名 字 集 合 ， 所 以 ， 最 好 将 它 声明 为 外 部 
变量 ， 这 样 ， 只 需要 初始 化 一 次 ， 所 有 的 地 方 都 可 以 使 用 。 这 种 结构 
的 初始 化 方法 同 前 面 所 述 的 初始 化 方 法 类 似 一 一 在 定义 的 后 面 通过 一 
个 用 圆 括 号 括 起 来 的 初 值 表 进 行 初 始 化 ， 如 下 所 示 : 

struct key { char *word; int count; 

} keytab[] = { 

"auto", 0， 

"break", 0, 

"case", 0, 

"char", 0, 

"const", 0, 

"continue", 0, 

"default", 0, 

/se T] 


"unsigned", 0， 


"void", 0, 
"volatile", 0, 
"while", 0 

}; 


与 结构 成 员 相 对 应 ， 初 值 也 要 按照 成 对 的 方式 列 出 。 更 精确 的 做 法 是 ， 
将 每 一 行 ( 即 每 个 结 构 ) 的 初 值 都 括 在 花 括 写 内 ， 如 下 所 示 : 











{ "auto", O }, 
{ "break", 0 }, 


{ "case", O }, 





但 是 ， 如 有 果 初 值 是 简单 变量 或 字符 串 ， 并 且 其 中 的 任何 值 都 不 为 空 ， 则 
内 层 的 花 插 号 可 以 省 略 。 通 常情 况 下 ， 如 果 初 值 存在 并 且 方 括号 [] 中 没 
有 数值 ， 编 译 程序 将 计算 数组 keytab 中 的 页 数 。 

在 统计 关键 字 出 现 次 数 的 程序 中 ， 我 们 首先 定义 了 keytab。 主 程序 反复 
调用 函数 getword 读 取 输入 ， 每 次 读 取 一 个 单词 。 每 个 单词 将 通过 折 半 
查找 函数 (参见 第 3 E)E keytab 中 进行 查找 。 注 意 ， 关 键 字 列表 必须 按 
升序 存储 在 keytab 中 。 

#include <stdio.h> 

#include <ctype.h> 

#include <string.h> 


#define MAXWORD 100 


int getword(char *, int); 


int binsearch(char *, struct key *, int); 

/* count C keywords */ main() 

{ 

int n; 

char word[MA XWORD)]; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 
if ((n = binsearch(word, keytab, NKEYS)) >= 0) keytab[n].count++; 
for (n = 0; n < NKEYS; n++) if (keytab[n].count > 0) 

printf("%4d %s\n", 

keytab[n].count, keytab[n].word); 

return 0; 

} 


/* binsearch: find word in tab[0]...tab[ne1] */ int binsearch(char 
*word, struct key tab[], int n) 


{ 

int cond; 

int low, high, mid; 
low = 0; 

high =n 1; 


while (low <= high) { mid = (low+high) / 2; 


if ((cond = strcmp(word, tab[mid].word)) < 0) high = mid ° 1; 

else if (cond > 0) low = mid + 1; 

else 

return mid; 

} 

return °1; 

} 

函数 getword 将 在 稍 后 介绍 ， 这 里 只 需要 了 解 它 的 功能 是 每 调用 一 次 该 
图 数 ， 将 读 入 一 个 单词 ， 并 将 其 复制 到 名 字 为 该 函数 的 第 一 个 参数 的 
数组 中 。 

NKEYS 代表 keytab 中 关键 字 的 个 数 。 尽 管 可 以 手工 计算 ， 但 由 机 器 实 
现 会 更 简单 、 更 安全 ， 当 列表 可 能 变更 时 尤其 如 此 。 一 种 解决 办 法 
是 ， 在 初 值 表 的 结尾 处 加 上 一 个 空 指针 ， 然后 循环 退 历 keytab， 直 到 读 
到 尾部 的 空 指针 为 止 。 


但 实际 上 并 不 需要 这 样 做 ， 因 为 数组 的 长 度 在 编译 时 已 经 完全 确定 ， 它 
等 于 数组 页 的 长 度 乘 以 页 数 ， 因 此 ， 可 以 得 出 页 数 为 : 


Keytab 的 长 度 /struct key 的 长 度 


C 语言 提供 了 一 个 编译 时 (compile*time) 一 元 运算 符 sizeof， 它 可 用 来 
计算 任 一 对 象 的 长 度 。 表 达 式 


sizeof 对 象 
以 及 





sizeof( 类 型 名 ) 


将 返回 一 个 整 型 值 ， 它 等 于 指定 对 象 或 类 型 占用 的 存储 空间 字 节 数 。 
(严格 地 说 ，sizeof 的 返回 值 是 无 符号 整 型 值 ， 其 类 型 为 size_t， 该 类 型 
在 头 文 件 <stddef.h> 中 定义 。) 其 中 ， 对象 可 以 是 变量 、 数 组 或 结构 ;类 型 
可 以 是 基本 类 型 ， 如 int、double， 也 可 以 是 派生 类 型 ， 如 结构 类 型 或 
指针 类 型 。 


在 该 例子 中 ， 关 键 字 的 个 数 等 于 数组 的 长 度 除 以 单个 元 素 的 长 度 。 下 面 
的 #define 语句 使 用 了 这 种 方法 设置 NKEYS 的 值 : 


#define NKEYS (sizeof keytab / sizeof(struct key)) 

Fy FRE FE A BB AR BE BR FE JOR INTR BE, GP tas: 
#define NKEYS (sizeof keytab / sizeof(keytab[0])) 

使 用 第 二 种 方法 ， 即 使 类 型 改变 了 ， 也 不 需要 改动 程序 。 


条 件 编译 语句 ##f 中 不 能 使 用 sizeof， 因 为 预 处 理 器 不 对 类 型 名 进行 分 
析 。 但 预 处 理 器 并 不 计算 #define 语句 中 的 表达 式 ， 因 此 ， 在 #define 中 
使 用 sizeof 是 合法 的 。 


下 面 来 讨论 函数 getword。 我 们 这 里 给 出 一 个 更 通用 的 getword 函数 。 
该 函数 的 功能 已 超出 这 个 示例 程序 的 要 求 ， 不 过 ， 函 数 本 里 并 不 复 
杂 。getword 从 输入 中 读 取 下 一 个 单词 ， 单 词 可 以 是 以 字母 开 尖 的 字母 
和 数字 串 ， 也 可 以 是 一 个 非 空白 符 字 符 。 函 数 返回 值 可 能 是 单 词 的 第 
了 字符、 文件 结束 符 EOF 或 字符 本 里 (如 果 该 字符 不 是 字母 字符 的 

话 )。 


























/* getword: get next word or character from input */ int getword(char 
*word, int lim) 


{ 
int c, getch(void); void ungetch(int); char *w = word; 


while (isspace(c = getch())) 


if (c != EOF) 

*wW++ =C; 

if (lisalpha(c)) { 

*w = '\0'; return c; 

} 

for ( ; **lim > 0; w++) 

if (lisalnum(*w = getch())) { ungetch(*w); 

break; 

} 

*w = '\0'; return word[0]; 

} 

getword 函数 使 用 了 第 4 章 中 的 函数 getch 和 ungetch。 当 读 入 的 字符 不 
属于 字母 数 字 的 集合 时 ， 说 明 getword 多 读 入 了 一 个 字符 。 随 后 ， 调 用 
ungetch 将 多 读 的 一 个 字符 放 回 到 输入 中 ， 以 便 下 一 次 调用 使 用 。 
Getword 还 使 用 了 其 它 一 些 函 数 :isspace 函数 跳 过 空 白 符 ，isalpha 函数 


识别 字母 ，isalnum 函数 识别 字母 和 数字 。 上 所 有 这 些 函 数 都 定义 在 标准 
头 文件 <ctype.h> 中 。 





练习 6e1 E28 getword 函数 个 能 正确 处 理 下 划 线 、 字 符 串 种 量 、 
注释 及 预 处 理 器 控制 指令 。 请 编写 一 个 更 完善 的 getword 函数 。 


6.4 指 问 结构 的 指针 


为 了 进一步 说 明 指 向 结构 的 指针 和 结构 数组 ， 我 们 重新 编写 关键 字 统计 
程序 ， 这 次 采用 指针 ， 而 不 使 用 数组 下 标 。 


keytab 的 外 部 声明 不 需要 修改 ， 但 main 和 binsearch 函数 必须 修改 。 修 
改 后 的 程序 如 下 : 


#include <stdio.h> 











#include <ctype.h> 

#include <string.h> 

#define MAXWORD 100 

int getword(char *, int); 

struct key *binsearch(char *, struct key *, int); 

/* count C keywords; pointer version */ main() 

{ 

char word[MAXWORD)]; struct key *p; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 
if ((p=binsearch(word, keytab, NKEYS)) != NULL) p*>count++; 
for (p = keytab; p < keytab + NKEYS; p++) if (pe>count > 0) 
printf("%4d %s\n", ps>count, p»>word); return 0; 


} 


/* binsearch: find word in tab[0]...tab[ne1] */ 

struct key *binsearch(char *word, struck key *tab, int n) 
{ 

int cond; 

struct key *low = &tab[0]; struct key *high = &tab[n]; struct key *mid; 
while (low < high) { 

mid = low + (highelow) / 2; 

if ((cond = strcmp(word, mid*>word)) < 0) high = mid; 
else if (cond > 0) low = mid + 1; 

else 

return mid; 

} 

return NULL; 


} 





这 里 需要 注意 几 点 。 首 先 ，binsearch 函数 在 声明 中 必须 表明 : 它 返回 的 
值 类 型 是 一 个 Fela) struct key 类 型 的 指针 ， 而 非 整 型 ， 这 在 函数 原型 及 
binsearch 函数 中 都 要 声明 。 如 果 binsearch 找到 与 输入 单词 匹配 的 数组 
元 素 ， 它 将 返回 一 个 指 问 该 元 素 的 指针 ， 否 则 返 回 NULL. 


其 次 ，keytab 的 元 素 在 这 里 是 通过 指针 访问 的 。 这 束 需 要 对 binsearch 
做 较 大 的 修改 。 在 这 里 ，low 和 high 的 初 值 分 别 是 指向 表 头 元 素 的 指 
针 和 指 癌 表 尾 元 素 后 面 的 一 个 元 素 











的 指针 。 
这 样 ， 我 们 就 无 法 简单 地 通过 下 列表 达 式 计算 中 间 元 素 的 位 置 : 
mid = (low+high) / 2 /* WRONG */ 


这 是 因为 ， 两 个 指针 之 间 的 加 法 运算 是 非法 的 。 但 是 ， 指 针 的 减法 运算 
却 是 合法 的 ，high*low 的 值 束 是 数组 元 素 的 个 数 ， 因 此 ， 可 以 用 下 列表 
JATIN: 

mid = low + (highelow) / 2 

将 mid 设置 为 指向 位 于 high A low 之 间 的 中 间 元 素 的 指针 。 对 算法 的 
eee 要 确保 不 会 生成 非法 的 指针 ， 或 者 是 试图 访问 数组 范 
EZ 


的 元 素 。 问 题 在 于 ，&tab[*1] 和 &tab[n] 都 超出 了 数组 tab 的 范围 。 前 者 
征 绝对 非法 的 ， 


而 对 后 者 的 间接 引用 也 是 非法 的 。 但 是 ，C 语言 的 定义 保证 数组 末尾 
之 后 的 第 一 个 元 素 ( 即 


&tab[n]) 的 指针 算术 运算 可 以 正确 执行 。 
主 程序 main 中 有 下 列 语句 : 
for (p = keytab; p < keytab + NKEYS; p++) 


WR p 是 指 加 结构 的 指针 ， 则 对 p 的 算术 运算 需要 考虑 结构 的 长 度 ， 所 





以 ， 表 达 式 p++ 执 行 时 ， 将 在 p 的 基础 上 加 上 一 个 正确 的 值 ， 以 确保 得 
a A E 


但 是 ， 千 万 不 要 认为 结构 的 长 度 等 于 各 成 员 长 度 的 和 。 因 为 不 同 的 对 象 
有 不 同 的 对 齐 要 求 ， 所 以 ， 结 构 中 可 能 会 出 现 未 命名 的 " 空 穴 "(hole)。 
De iat E S E TO 





struct { 

char c; int i; 

} 

可 能 需要 8 个 字 节 的 存储 空间 ， 而 不 是 5 个 字 节 。 使 用 sizeof 运算 符 可 
以 返回 正确 的 对 象 AN FE 


最 后 ， 说 明 一 扣 程 序 的 格式 问题 : 当 函 数 的 返回 值 类 型 比较 复兴 时 (如 结 
构 指针 )， 例 如 





struct key *binsearch(char *word, struct key *tab, int n) 


REE HRA, BARRA ABE SC AS Shed RERA. RATAR 
用 为 一 种 格式 书写 上 述 语句 : 


struct key * 


binsearch(char *word, struct key *tab, int n) 


具体 采用 哪 种 写法 属于 个 人 的 习惯 问题 ， 可 以 选择 目 己 喜欢 的 方式 并 始 
终 保 持 上 自己 的 风格 。 


6.5 目 引 用 结构 


假定 我 们 需要 处 理 一 个 更 一 般 化 的 问题 :统计 输入 中 所 有 单词 的 出 现 次 
数 。 因 为 预先 不 知 着 出 现 的 单词 列表 ， 所 以 无 法 方便 地 排序 ， 并 使 用 
折 半 碍 找 ;也 不 能 分 别 对 输入 中 的 每 个 单词 都 执行 一 次 线性 查找 ， 看 它 
在 前 面 是 否 已 经 出 现 ， 这 样 做 ， 程 序 的 执行 将 花费 太 长 的 时 间 。( 更 准 
确 地 说 ， 程 序 的 执行 时 间 是 与 输入 单词 数目 的 二 次 方 成 比例 的 。) 我 们 
该 如 何 组 织 这 些 数 据 ， 才 能 够 有 效 地 处 理 一 系列 任意 的 单词 昵 ? 


一 种 解决 方法 是 ， 在 读 取 输入 中 任意 单词 的 同时 ， 就 将 它 放置 到 正确 的 
位 置 ， 从 而 始终 保证 所 有 单词 是 按 顺序 排列 的 。 虽 然 这 可 以 不 用 通过 
在 线性 数组 中 移动 单词 来 实现 ， 但 它 仍 然 会 导致 程序 执行 的 时 间 过 
长 。 我 们 可 以 使 用 一 种 称 为 二 叉 树 的 数据 结构 来 取而代之 。 
每 个 不 同 的 单词 在 树 中 都 是 一 个 节点 ， 每 个 节点 包含; 

一 个 指向 该 单词 内 容 的 指针 

一 个 统计 出 现 次 数 的 计数 什 

一 个 指向 左 子 树 的 指针 

一 个 指向 右 子 树 的 指针 
任何 节点 最 多 拥有 两 个 子 树 ， 也 可 能 只 有 一 个 子 树 或 一 个 都 没有 。 对 
节点 的 所 有 操作 要 保证 ， 任 何 节点 的 左 子 树 只 包含 按 字典 序 小 于 该 节点 
中 单词 的 那些 


单词 ， 右 子 树 只 包含 按 字 典 序 大 于 该 节点 中 单词 的 那些 单词 。 图 6.3 是 
按 序 插入 句子 “ now is the 


time for all good men to come to the aid of their party" 中 各 单词 后 生成 的 
BY 。 





























all good party their to 


aid come 


图 693 


要 得 找 一 个 新 单词 是 否 已经 在 树 中 ， 可 以 从 根 市 点 开始 ， 比 较 新 单词 与 
该 节点 中 的 单词 。 在 匹配 ， 则 得 到 肯定 的 答案 。 奉 新 单词 小 于 该 节点 
中 的 单词 ， 则 在 左 子 树 中 继续 查找 ， 人 否则 在 右 子 树 中 碍 找 。 如 在 搜寻 
方向 上 无 子 树 ， 则 说 明 新 单词 不 在 树 中 ， 并 且 ， 当 前 的 空位 置 就 是 存 
放 新 加 入 单词 的 正确 位 置 。 因 为 从 任意 节点 出 发 的 碍 找 都 要 按照 同样 的 
方式 碍 找 它 的 一 个 子 树 ， 所 以 该 过 程 是 递归 的 。 相 应 地 ， 在 插入 和 打 
印 操 作 中 使 用 递归 过 程 也 是 很 目 然 的 事情 。 


struct tnode { /* the tree node: */ 





char *word; /* points to the text */ 


int count; /* number of occurrences */ 


struct tnode *left; /* left child */ struct tnode *right; /* right 
child */ 


b 


这 种 对 市 点 的 递归 的 声明 方式 看 上 去 好 像 是 不 确定 的 ， 但 它 的 确 是 正确 
Ko “MESHES 实例 的 结构 是 非法 的 ， 但 是 ， 下 列 声明 是 合法 的 : 








struct tnode * left; 

它 将 left 声明 为 指向 node 的 指针 ， 而 不 是 thnode 实例 本 身 。 我 们 偶尔 

oe 自 引 用 结构 的 一 种 变 体 :两 个 结构 相互 引用 。 具 体 的 使 用 方法 
mF: 


struct t { 


struct s *p; /* p points to an s */ 
fs 


struct s { 


struct t *q; /* q points to at */ 

ts 

如 下 所 示 ， 整 个 程序 的 代码 非常 短小 。 当 然 ， 它 需要 我 们 前 面 编写 的 一 
些 程序 的 支持 ， 比如 getword 等 。 主 函数 通过 getword 读 入 单词 ， 并 通 
过 addtree 函数 将 它们 插入 到 树 中 。 


#include <stdio.h> 


#include <ctype.h> 


#include <string.h> 

#define MAXWORD 100 

struct tnode *addtree(struct tnode *, char *); void treeprint(struct tnode *); 
int getword(char *, int); 

/* word frequency count */ main() 

{ 

struct thode *root; char word/[MAXWORD]; 

root = NULL; 

while (getword(word, MAXWORD) != EOF) if (isalpha(word[0])) 

root = addtree(root, word); treeprint(root); 

return 0; 

} 

函数 addtree 是 递归 的 。 主 函数 main 以 参数 的 方式 传递 给 该 函数 的 一 个 
单词 将 作为 树 的 最 顶层 ( 即 树 的 根 )。 在 每 一 步 中 ， 新 单词 与 市 点 中 存储 
的 单词 进行 比较 ， 随 后 ， 通 过 递归 调用 addtree 而 转 回 左 子 树 或 右 子 
树 。 该 单词 最 终 将 与 树 中 的 菜 节 点 匹配 (这 种 情况 下 计数 值 加 1)， 或 过 


到 一 个 空 指针 (表明 必须 创建 一 个 节点 并 加 入 到 树 中 )。 知 生成 了 新 节 
Kio JUJ addtree 返回 一 个 指向 新 市 点 的 指针 ， 该 指针 保存 在 父 节 点 中 。 





struct tnode *talloc(void); char *strdup(char *); 


/* addtree: add a node with w, at or below p */ struct treenode 
*addtree(struct tnode *p, char *w) 


{ 
int cond; 
if (p == NULL) { /* anew word has arrived */ p = talloc(); /* 


make a new node */ ps>word = strdup(w); 
p*>count = 1; 


pe>left = p*>right = NULL; 


} else if ((cond = strcmp(w, p*>word)) == 0) p*>count++; /* repeated 
word */ 
else if (cond < 0) /* less than into left subtree */ p*>left = 


addtree(p*>left, w); 


else /* greater than into right subtree */ pe>right = addtree(pe>right, 
w); 


return p; 
} 


新 节点 的 存储 空间 由 子 程序 talloc 获得 。talloc 函数 返回 一 个 指针 ， 指 癌 
能 容纳 一 个 树 布 点 的 空间 空间 。 疯 数 strdup 将 新 单词 复制 到 某 个 隐藏 
位 置 ( 稍 后 将 讨论 这 些 子 程序 )。 计数 值 将 被 初始 化 ， 两 个 子 树 被 置 为 衬 
(NULL)。 增 加 新 节点 时 ， 这 部 分 代码 只 在 树叶 部 分 执 行 。 该 程序 忽略 
了 对 strdup 和 talloc 返回 值 的 出 错 检查 (这 显然 是 不 完善 的 )。 


treeprint 函数 按 顺 序 打印 树 。 在 每 个 节点 ， 它 先 打印 左 子 树 (小 于 该 单词 
的 所 有 单词 )， 然后 是 该 单词 本 身 ， 最 后 是 右 子 树 ( 大 于 该 单词 的 所 有 单 
词 )。 如 果 你 对 递归 操作 有 些 疑 惑 的 话 ， 不 妨 在 上 面 的 树 中 模拟 
treeprint 的 执行 过 程 。 






































/* treeprint: ineorder print of tree p */ void treeprint(struct tnode *p) 
{ 

if (p != NULL) { 

treeprint(p*>left); 

printf("%4d %s\n"", p*>count, p*>word); treeprint(p*>right); 

} 

} 


这 里 有 一 点 值得 注意 :如 果 单 词 不 是 按照 随机 的 顺序 到 达 的 ， 树 将 变 得 
不 平衡 ， 这 种 情 况 下 ， 程 序 的 运行 时 间 将 大 大 增加 。 最 坏 的 情况 下 ， 
右 单 词 已 经 排 好 序 ， 则 程序 模拟 线性 查 找 的 开销 将 非常 大 。 茶 些 广 义 
二 又 树 不 受 这 种 最 坏 情况 的 影响 ， 在 此 我 们 不 讨论 。 


在 结束 该 例子 之 前 ， 我 们 简单 讨论 一 下 有 关 存 储 分 配 程序 的 问题 。 尽 管 
存储 分 配 程序 需 要 为 不 同 的 对 象 分 配 存储 空间 ， 但 显然 ， 程 序 中 只 会 
有 一 个 存储 分 配 程序 。 但 是 ， 假 定 用 一 个 分 配 程序 来 处 理 多 种 类 型 的 
请 求 ， 比 如 指 疝 char 类 型 的 指针 和 指 问 struct tnode 类 型 的 指针 ， 则 会 
出 现 两 个 问题 。 第 一 ， 它 如 何在 大 多 数 实际 机 器 上 满足 各 种 类 型 对 象 的 
对 齐 要 求 ( 例 如 ， 整 型 通 稍 必须 分 配 在 偶数 地 址 上 )， 第 二 ， 使 用 什么 样 
的 声明 能 处 理 分 配 程序 必须 能 返回 不 同类 型 的 指针 的 问题 ? 


对 齐 要 求 一 般 比 较 容 易 满 足 ， 只 需要 确保 分 配 程序 始终 返回 满足 所 有 对 
齐 限 制 要求 的 指 针 就 可 以 了 ， 其 代价 是 牺牲 一 些 存储 空间 。 第 5 章 介 
AHJ alloc 函数 不 保证 任何 特定 类 型 的 对 齐 ， 所 以 ， 我 们 使 用 标准 库 函 
ee ne een 
Fi 





























对 于 任何 执行 严格 类 型 检查 的 语言 来 说 ， 像 malloc 这 样 的 函数 的 类 型 
声明 总 是 很 令 人 头疼 的 问题 。 在 C 语言 中 ， 一 种 合适 的 方法 是 将 
malloc 的 返回 值 声 明 为 一 个 指向 void 类 型 的 指针 ， 然 后 再 显 式 地 将 该 
指针 强制 转换 为 所 需 类 型 。malloc 及 相关 函数 声明 在 标准 头 文 件 
<stdlib.h> 中 。 因 此 ， 可 以 把 talloc 函数 写成 下 列 形 式 : 








#include <stdlib.h> 
/* talloc: make a tnode */ struct tnode *talloc(void) 
{ 


return (struct tnode *) malloc(sizeof(struct tnode)); 
} 


m 函数 只 是 把 通过 其 参数 传 入 的 字符 串 复 制 到 某 个 安全 的 位 置 。 它 
过 调用 


malloc 函数 实现 的 : 





char *strdup(char *s) /* make a duplicate of s */ 

{ 

char *p; 

p = (char *) malloc(strlen(s)+1); /* +1 for \0' */ if (p != NULL) 
strcpy(p, s); return p; 

} 


在 没有 可 用 空间 时 ，malloc 函数 返回 NULL， 同 时 ，strdup 函数 也 将 返 
E] NULL, strdup 


函数 的 调用 者 负责 出 错 处 理 。 


调用 malloc 函数 得 到 的 存储 空间 可 以 通过 调用 free 函数 释放 以 重用 。 
详细 信息 请 参 见 第 7 章 和 第 8 章 。 


练习 692 编写 一 个 程序 ， 用 以 读 入 一 个 C 语言 程序 ， 并 按 字 母 表 
顺序 分 组 打印 变量 名 ， 要 求 每 一 组 内 各 变量 名 的 前 6 个 字符 相同 ， 其 
余 字 符 不 同 。 字 符 串 和 注释 中 的 单词 不 予 考虑 。 

请 将 6 作为 一 个 可 在 命令 行 中 设 定 的 参数 。 

练习 693 编写 一 个 交叉 引用 程序 ， 打 印 文档 中 所 有 单词 的 列表 ， 
并 且 每 个 单词 还 有 一 个 列表 ， 记 录 出 现 过 该 单词 的 行 号 。 对 the、and 
等 非 实 义 单词 不 予 考虑 。 

练习 694 编写 一 个 程序 ， 根 据 单 词 的 出 现 频率 按 降 序 打 印 输入 的 
各 个 不 同 单词 ， 并 在 每 个 单词 的 前 面 标 上 它 的 出 现 次 数 。 

6.6 KEFR 


为 了 对 结构 的 更 多 方面 进行 深入 的 讨论 ， 我 们 来 编写 一 个 表 查 找 程 序 包 
的 核心 部 分 代码 。 这 段 代 码 很 典型 ， 可 以 在 宏 处 理 占 或 编译 器 的 从 号 
表 管 理 例 程 中 找到 。 例 如 ， 考 虑 #define 语句 。 当 过 到 类 似 于 

#define IN1 


之 类 的 程序 行 时 ， 就 需要 把 名 字 IN 和 替换 文本 1 存 入 到 某 个 表 中 。 此 
后 ， 当 名 字 IN 出 现在 茶 些 语句 中 时 ， 如 : 

















statet = IN; 
就 必须 用 1 来 替换 IN。 


以 下 两 个 函数 用 来 处 理 名 字 和 和 葵 换 文本 。install(s, tee BURA F s ATS HR 
LA t 记录 到 某 个 表 中 ， 其 中 s 和 t 仅仅 是 字符 串 。lookup(s) 函 数 在 表 
PARR s, ARAL Mik 回 指向 该 处 的 指针 ;大 没 找 到 ， 则 返回 

NULL. 


该 算法 采用 的 是 散 列 查找 方法 一 将 输入 的 名 字 转 换 为 一 个 小 的 非 负 整 
数 ， 该 整数 随后 将 作为 一 个 指针 数组 的 下 标 。 数 组 的 每 个 元 素 指向 革 
个 链表 的 表 头 ， 链 表 中 的 各 个 块 用 于 描 述 具 有 该 散 列 值 的 名 字 。 如 果 
没有 名 字 散 列 到 该 值 ， 则 数组 元 素 的 值 为 NULL( 参 见 图 6.4)。 











图 6.4 


链表 中 的 每 个 块 都 是 一 个 结构 ， 它 包含 一 个 指向 名 字 的 指针 、 一 个 指 癌 
蕉 换文 本 的 指针 以 及 一 个 指 疝 该 链表 后 继 块 的 指针 。 如 果 指 问 链 表 后 
继 块 的 指针 为 NULL， 则 表明 链表 结束 。 


struct nlist { /* table entry: */ 

struct nlist *next; /* next entry in chain */ char 
*name; /* defined name */ 

char *defn; /* replacement text */ 

+ 


相应 的 指针 数组 定义 如 下 : 


#define HASHSIZE 101 
Static struct nlist *hashtablHASHSIZE]; /* pointer table */ 


散 列 函数 hash 在 lookup 和 install 函数 中 都 被 用 到 ， 它 通过 一 个 for 循 
环 进行 计 算 ， 每 次 循环 中 ， 它 将 上 一 次 循环 中 计算 得 到 的 结果 值 经 过 
ee aise eal 同 字符 串 中 当前 字符 的 值 相 加 (*s + 31 * 
a 然后 将 该 结果 值 同 数组 长 度 执行 取 模 操 作 ， 其 结果 即 是 该 函 
数 的 返回 值 。 这 并 不 是 最 好 的 散 列 了 数 ， 但 比较 简短 有 效 。 








/* hash: form hash value for string s */ unsigned hash(char *s) 

{ 

unsigned hashval; 

for (hashval = 0; *s != '\0'; s++) hashval = *s + 31 * hashval; 

return hashval % HASHSIZE; 

} 

由 于 在 散 列 计算 时 采用 的 是 无 符号 算术 运算 ， 因 此 保证 了 散 列 值 非 负 。 


散 列 过 程 生成 了 在 数组 hashtab 中 执行 得 找 的 起 始 下 标 。 如 采 该 字符 串 
可 以 被 碍 找到 ， 











则 它 一 定位 于 该 起 始 下 标 指 同 的 链表 的 某 个 块 中 。 有 具体 得 找 过 程 由 
lookup 函数 实现 。 如 果 


lookup 函数 友 现 表 页 已 存在 ， 则 返回 指 问 该 表 页 的 指针 ， 否 则 返回 
NULL. 





/* lookup: look for s in hashtab */ struct nlist *lookup(char *s) 


{ 


struct nlist *np; 


for (np = hashtab[hash(s)]; np != NULL; np = npe>next) if (stremp(s, 
np*>name) == 0) 

return np; /* found */ return NULL; /* not found */ 

} 


lookup 函数 中 的 for 循环 是 吉 历 一 个 链表 的 标准 方法 ， 如 下 所 示 : 


for (ptr = head; ptr != NULL; ptr = ptre>next) 








install 函数 借助 lookup 函数 判断 待 加 入 的 名 字 是 否 已 经 存在 。 如 果 已 存 
在 ， 则 用 新 的 定义 取而代之 ;个 则 ， 创 建 一 个 新 表 页 。 如 无 足够 空间 创 
建新 表 页 ， 则 install 函数 返回 NULL. 

struct nlist *lookup(char *); char *strdup(char *); 


/* install: put (name, defn) in hashtab */ struct nlist *install(char 
*name, char *defn) 


{ 


struct nlist *np; unsigned hashval; 


if ((np = lookup(name)) == NULL) { /* not found */ np = (struct nlist *) 
malloc(sizeof(*np)); 


if (np == NULL || (np*>name = strdup(name)) == NULL) return NULL; 
hashval = hash(name); np*>next = hashtab[hashval]; hashtab[hashval] = np; 
} else /* already there */ 


free((void *) np*>defn); /*free previous defn */ if ((np*>defn = 
strdup(defn)) == NULL) 


return NULL; return np; 


} 

练习 695 编写 函数 undef， 它 将 从 由 lookup 和 install 维护 的 表 中 
删除 一 个 变量 及 其 定义 。 

练习 6。6 以 本 节 介 绍 的 函数 为 基础 ， 编 写 一 个 适合 C 语言 程序 使 





用 的 #define 处 理 恬 的 简单 版 本 ( 即 无 参数 的 情况 )。 你 会 发 现 getch 和 
ungetch 函数 非常 有 用 。 


6.7 类 型 定义 Ctypedef) 


C 语言 提供 了 一 个 称 为 typedef 的 功能 ， 它 用 来 建立 新 的 数据 类 型 名 ， 
例如 ， 声 明 


typedef int Length; 


将 Length 定义 为 与 int 具有 同等 意义 的 名 字 。 类 型 Length 可 用 于 类 型 
声明 、 类 型 转换 等 ， 它 和 类 型 int 完全 相同 ， 例 如 : 








Length len, maxlen; Length *lengths[]; 
类 似 地 ， 声 明 
typedef char* String; 


将 String 定义 为 与 char * 或 字符 指针 同 义 ， 此 后 ， 便 可 以 在 类 型 声明 和 
类 型 转换 中 使 用 String， 例 如 : 


String p, lineptr[T MAXLINES], alloc(int); int strcmp(String, String); 

p = (String) malloc(100); 

TER, typedef 中 声明 的 类 型 在 变量 名 的 位 置 出 现 ， 而 不 是 紧 接 在 关键 
字 typedef 之 后 。typedef 在 语法 上 类 似 于 存储 类 extern、static 等 。 我 们 
在 这 里 以 大 写字 母 作为 typedef 定义 的 类 型 名 的 前 字母 ， 以 示 区 别 。 


eee 的 例子 :用 typedef jE MASERU TAT AAMT A YOR 
示 : 











typedef struct tnode *Treeptr; 


typedef struct tnode { /* the tree node: */ char *word; /* points to the 
text */ 
int count; /* number of occurrences */ struct tnode *left; 
/* left child */ 
struct tnode *right; /* right child */ 


} Treenode; 


上 述 类 型 定义 创建 了 两 个 新 类 型 关键 字 :Treenode( 一 个 结构 ) 和 


Treeptr( 一 个 指 回 该 结构 的 指针 )。 这 样 ， 函 数 talloc 可 相应 地 修改 为 : 
Treeptr talloc(void) 

{ 

return (Treeptr) malloc(sizeof(Treenode)); 

} 


这 里 必须 强调 的 是 ， 从 任何 意义 上 讲 ，typedef 声明 并 没有 创建 一 个 新 
类 型 ， 它 只 是 为 某 个 已 存在 的 类 型 增加 了 一 个 新 的 名 称 而 已 。typedef 
声明 也 没有 增加 任何 新 的 语义 :通过 这 种 方式 声明 的 变量 与 通过 普通 声 
明 方式 声明 的 变量 具有 完全 相同 的 属性 。 实 际 上 ，typedef 类 似 于 
#define 语句 ， 但 由 于 typedef 是 由 编译 器 解释 的 ， 因 此 它 的 文本 蔡 换 功 
能 要 超过 预 处 理 器 的 能 力 。 例 如 : 


typedef int (*PFI)(char *, char *); 
该 语句 定义 了 类 型 PFI 是 "一 个 指 问 函数 的 指针 ， 该 函数 具有 两 个 char * 


类 型 的 参数 ， 返 回 值 类 型 为 int"， 它 可 用 于 某 些 上 下 文中 ， 例 如， 可 以 
用 在 第 5 半 的 排序 程序 中 ， 如 下 所 示 : 




















PFI strcmp, numcmp; 


除了 表达 方式 更 简洁 之 外 ， 使 用 typedef 还 有 另外 两 个 重要 原因 。 首 
先 ， 它 可 以 使 程序 参数 化 ， 以 提高 程序 的 可 移植 性 。 如 果 typedef 声明 
的 数据 类 型 同 机 器 有 关 ， 那 么 ， 当 程序 


移植 到 其 它 机 器 上 时 ， 只 需 改 变 typedef 类 型 定义 就 可 以 了 。 一 个 经 党 
用 到 的 情况 是 ， 对 于 各 种 不 同 大 小 的 整 型 值 来 说， 都 使 用 通过 typedef 
定义 的 类 型 名 ， 然 后 ， 分 别 为 各 个 不 同 的 宿主 机 选择 一 组 合适 的 
short. int 和 long 类 型 大 小 即 可 。 标 准 库 中 有 一 些 例子 ， 例 如 size_t 和 
ptrdiff_t 等 。 


typedef 的 第 二 个 作用 是 为 程序 提供 更 好 的 说 明 性 
比 一 个 声明 为 指向 复杂 结构 的 指针 更 容易 让 人 理解 。 


6.8 联合 


联合 是 可 以 (在 不 同时 刻 ) 保 存 不 同类 型 和 长 度 的 对 象 的 变量 ， 编 译 占 负 
DER ERT RAY 长 度 和 对 齐 要 求 。 联 合 提供 了 一 种 方式 ， 以 在 单 块 存储 
区 中 管理 不 同类 型 的 数据 ， 而 不 需要 EEF RE AAT) La KH 
信息 。 它 类 似 于 Pascal 语言 中 的 变 体 记录 。 


我 们 来 看 一 个 例子 (可 以 在 编译 圳 的 符号 表 管 理 程序 中 找到 该 例子 )。 假 
设 一 个 常量 可 能 是 int. float 或 字符 指针 。 特 定 类 型 的 常量 值 必须 保存 
在 合适 类 型 的 变量 中 ， 然 而 ， 如 果 该 常量 的 不 同类 型 占据 相同 大 小 的 
存储 空间 ， 且 保存 在 同一 个 地 方 的 话 ， 表 管理 将 最 方便 。 这 就 是 联合 
的 目的 一 一 一 个 变量 可 以 合法 地 保存 多 种 数据 类 型 中 任何 一 种 类 型 的 对 
象 。 其 语 法 基于 结构 ， 如 下 所 示 : 





Treeptr 类 型 显然 























union u_tag { int ival; float fval; char *sval; 

}u; 

变量 u 必须 足够 大 ， 以 保存 这 3 种 类 型 中 最 大 的 一 种 ， 具 体 长 度 同 具体 
的 实现 有 关 。 这 些 类 型 中 的 任何 一 种 类 型 的 对 象 都 可 赋值 给 u， 且 可 使 
用 在 随后 的 表达 式 中 ， 但 必须 保证 是 一 致 的 : 读 取 的 类 型 必须 是 最 近 一 
次 存 入 的 类 型 。 程 序 员 负 责 跟踪 当前 保存 在 联合 中 的 类 型 。 如 果 保 存 
的 类 型 与 读 取 的 类 型 不 一 致 ， 其 结果 取决 于 具体 的 实现 。 

可 以 通过 下 列 语法 访问 联合 中 的 成 员 : 


联合 名 .成 员 














或 
联合 指针 *> 成 员 


它 与 访问 结构 的 方式 相同 。 如 采用 变量 utype 跟踪 保存 在 u 中 的 当前 数 
所 类 型 ， 则 可 以 像 下 面 这 样 使 用 联合 : 


if (utype == INT) printf("%d\n", u.ival); 





if (utype == FLOAT) printf("%f\n", u.fval); 

if (utype == STRING) printf("%s\n", u.sval); 

else 

printf("bad type %d in utype\n", utype); 

联合 可 以 使 用 在 结构 和 数组 中 ， 反 之 亦 可 。 访 问 结构 中 的 联合 (或 反之 ) 


的 某 一 成 员 的 表示 法 与 租 套 结构 相同 。 例 如 ,假定 有 下 列 的 结构 数组 
定义 : 





struct { 

char *name; int flags; int utype; union { 

int ival; float fval; char *sval; 

} u; 

} symtab[NSYM]; 

可 以 通过 下 列 语句 引用 其 成 员 ival: symtab[i].u.ival 

也 可 以 通过 下 列 语句 之 一 引用 字符 串 sval 的 第 一 个 字符 : 
*symtab[i].u.sval symtab[i].u.sval[0] 

实际 上 ， 联 合 束 是 一 个 结构 ， 它 的 所 有 成 员 相 对 于 基地 址 的 偏 移 量 都 为 
0， 此 结构 空间 要 大 到 足够 容纳 最 " 宽 " 的 成 员 ， 并 且 ， 其 对 章 方式 要 适 
合 于 联合 中 所 有 类 型 的 成 员 。 对 联合 允许 的 操作 与 对 结构 允许 的 操作 
相同 :作为 一 个 整体 单元 进行 赋值 、 复 制 、 取 地 址 及 访问 其 中 一 个 成 
风 。 


联合 只 能 用 其 第 一 个 成 员 类 型 的 值 进 行 初始 化 ， 因 此 ， 上 述 联合 u 只 能 
用 整数 值 进行 初 始 化 。 

第 8 章 的 存储 分 配 程序 将 说 明 如 何 使 用 联合 来 强制 一 个 变量 在 特定 类 型 
的 存储 边界 上 对 齐 。 

6.9 位 字段 

在 存储 空间 很 宝贵 的 情况 下 ， 有 可 能 需要 将 多 个 对 象 保存 在 一 个 机 器 字 
中 。 一 种 常用 的 方法 是 ， 使 用 类 似 于 编译 器 符号 表 的 单个 二 进 制 位 标 
志 集合 。 外 部 强加 的 数据 格式 (如 硬件 设备 接口 ) 也 经 常 需要 从 字 的 部 分 
值 中 读 取 数 据 。 


考 碟 编译 需 中 符号 表 操 作 的 有 关 细 节 。 程 序 中 的 每 个 标识 符 都 有 与 之 相 
关 的 特定 信息 ， 例 如 ， 它 是 否 为 关键 字 ， 它 是 舍 是 外 部 的 且 ( 或 ) 是 静态 






































的 ， 等 等 。 对 这 些 信息 进行 编码 的 最 简 清 的 方法 吉 是 使 用 一 个 char 或 
int 对 象 中 的 位 标志 集合 。 


通常 采用 的 方法 是 ， 定 义 一 个 与 相关 位 的 位 置 对 应 的 "屏蔽 码 " 集 合 ， 如 : 


#define KEYWORD 01 














#define EXTRENAL 02 

#define STATIC 04 

或 

enum { KEYWORD = 01, EXTERNAL = 02, STATIC = 04 }; 


这 些 数字 必须 是 2 的 军 。 这 样 ， 访 问 这 些 位 就 变 成 了 用 第 2 章 中 描述 的 
移 位 运算 、 屏 项 运 算 及 补 码 运算 进行 简单 的 位 操作 。 


下 列 语句 在 程序 中 经 常 出 现 : 


flags |= EXTERNAL | STATIC; 

该 语句 将 flags 中 的 EXTERNAL 和 STATIC 位 置 为 1， 而 下 列 语句 : 
flags &= ~(EXTERNAL | STATIC); 

则 将 它们 置 为 0。 并且， 当 这 两 位 都 为 0 时， 下 列表 达 式 : 

if ((flags & (EXTERNAL | STATIC)) == 0)... 

的 值 为 真 。 

尽管 这 些 方法 很 容易 掌握 ， 但 是 ，C 语言 仍然 提供 了 男 一 种 可 替代 的 方 
法 ， 即 直接 定义 和 访问 一 个 字 中 的 位 字段 的 能 力 ， 而 不 需要 通过 按 位 
逻辑 运算 符 。 位 字段 (bit*field)， 或 简称 字 段 ， 是 " 字 '" 中 相 邻 位 的 集 


合 。" 字 "(word) 是 单个 的 存储 单元 ， 它 同 具体 的 实现 有 关 。 例 wm, ER 
从 写 表 的 多 个 #define 语句 可 用 下 列 3 个 字段 的 定义 来 代 蔡 : 








struct { 


unsigned int is_keyword : 1; unsigned int is_extern : 1; unsigned int is_static 
“ly 


} flags; 


这 里 定义 了 一 个 变量 flags， 它 包含 3 个 一 位 的 字段 。 冒 号 后 的 数字 表示 
字段 的 宽度 (用 二 进 制 位 数 表 示 )。 字 段 被 声明 为 unsigned int 类 型 ， 以 
保证 它们 是 无 符号 量 。 

单个 字段 的 引用 方式 与 其 它 结构 成 员 相 同 ， 例 如 : flags.is_keyword 、 
flags.is_extern 等 等 。 字 段 的 作用 与 小 整数 相似 。 同 其 它 整数 一 样 ， 字 段 
可 出 现在 算术 表达 式 中 。 因 此 ， 上 面 的 例子 可 用 更 自然 的 方式 表达 为 : 


flags.is_extern = flags.is_static = 1; 该 语句 将 is_extern 和 is_static 位 置 为 
1。 和 下列 语句 : flags.is_extern = flags.is_static = 0; 


将 is_extern 和 is static 位 置 为 0。 下 列 语句 : 








if (flags.is_extern == 0 && flags.is_static == 0) 


用 于 对 is_extern 和 is_static 位 进行 测试 。 字段 的 所 有 属性 几乎 都 同 具 体 
的 实现 有 关 。 字 段 是 否 能 履 盖 字 边 界 由 具体 的 实现 定义 。 


字段 可 以 不 命名 ， 无 名 字段 (只 有 一 个 冒号 和 宽度 ) 起 填充 作用 。 特 殊 宽 
E 0 可 以 用 来 强制 


EPST URENT 


某 些 机 器 上 字段 的 分 配 是 从 字 的 左 端 至 右 端 进行 的 ， 而 某 些 机 器 上 则 相 
反 。 这 意味 着 ， 尽管 字段 对 维护 内 部 定义 的 数据 结构 很 有 用 ， 但 在 选 
择 外 部 定义 数据 的 情况 下 ， 必 须 仔 细 考 虚 哪 端 优先 的 问题 。 依 赖 于 这 
些 因 素 的 程序 是 不 可 移植 的 。 字 段 也 可 以 仅仅 声明 为 nt， 为 了 方便 移 
植 ， 需 要 显 式 声明 该 int 类 型 是 signed 还 是 unsigned 类型。 字段 不 是 数 


组 ， 并 且 没 有 地 址 ， 因 此 对 它们 不 能 使 用 & 运算 符 。 











第 7 草 输入 与 输出 


输入 /输出 功能 并 不 是 C 语言 本 里 的 组 成 部 分 ， 所 以 到 目前 为 止 ， 我们 
并 没有 过 多 地 强 调 它们 。 但 是 ， 程 序 与 环境 之 间 的 交互 比 我 们 在 前 面 
部 分 中 描述 的 情况 要 复杂 很 多 ， 本 章 将 讲述 标准 库 ， 介 绍 一 些 输入 / 笨 
出 函数 、 字 符 串 处 理 函 数 、 存 储 管理 函数 与 数学 图 数 ， 以 及 其 它 一 些 C 
语言 程序 的 功能 。 本 章 讨论 的 重点 将 放 在 输入 /输出 上 。 


ANSI 标准 精确 地 定义 了 这 些 库 函 数 ， 所 以 ， 在 任何 可 以 使 用 C 语言 的 
系统 中 都 有 这 些 函 数 的 兼容 形式 。 如 果 程序 的 系统 交互 部 分 仅仅 使 用 
E E E 


这 些 库 函 数 的 属性 分 别 在 十 多 个 头 文件 中 声明 ， 前 面 已 经 遇 到 过 一 部 
分 ， 如 <stdio.h>、 


<string.h> 和 <ctype.h>。 我 们 不 打算 把 整个 标准 库 都 罗列 于 此 ， 因 为 我 们 
更 关心 如 何 使 


用 标准 库 编写 C 语言 程序 。 附 录 B 对 标准 库 进行 了 详细 的 描述 。 
7.1 标准 输入 /输出 

我 们 在 第 1 章 中 讲 过 ， 标 准 库 实现 了 简单 的 文本 输入 /输出 模式 。 文 本 
流 由 一 系列 行 组 成 ， 每 一 行 的 结尾 是 一 个 换行 符 。 如 果 系 统 没有 遵循 
这 种 模式 ， 则 标准 库 将 通过 一 些 措施 使 得 该 系统 适应 这 种 模式 。 例 


如 ， 标 准 库 可 以 在 输入 端 将 回 车 符 和 换行 符 都 转换 为 换行 符 ， 而 在 输 
出 端 进行 反 同 转换 。 


最 简单 的 输入 机 制 是 使 用 getchar 函数 从 标准 输入 中 (一 般 为 键盘 ) 一 次 读 
aed ree 


























int getchar(void) 


getchar 函数 在 每 次 被 调用 时 返回 下 一 个 输入 字符 。 若 遇 到 文件 结尾 ， 则 
返回 EOF。 符 号 常 量 EOF 在 头 文 件 <stdio.h> 中 定义 ， 其 值 一 般 为 1， 





但 程序 中 应 该 使 用 EOF 来 测试 文件 是 否 结束 ， 这 样 才能 保证 程序 同 
EOF 的 特定 值 无 关 。 


在 许多 环境 中 ， 可 以 使 用 符号 < 来 实现 输入 重 定 同 ， 它 将 把 键盘 输入 蔡 
换 为 文件 输入 :如 果 程 序 prog 中 使 用 了 函数 getchar， 则 命令 行 


prog < infile 


将 使 得 程序 prog 从 输入 文件 infile( 而 不 是 从 键盘 ) 中 读 取 字符 。 实 际 

E, FEF prog 本 号 并 不 在 意 输入 方式 的 改变 ， 并 且 ， 字 符 串 "<infile" 也 
并 不 包含 在 argv 的 命令 行 参数 中 。 如 果 输 入 通过 管道 机 制 来 自 于 男 一 
个 程序 ， 那 么 这 种 输入 切换 也 是 不 可 见 的 。 比 如 ， 在 东 些 系统 中 ， 下 


列 命 令 行 : 





otherprog | Prog 


将 运行 两 个 程序 otherprog 和 prog， 并 将 程序 otherprog 的 标准 输出 通过 
管道 重 定 癌 到 程序 prog 的 标准 输入 上 。 


PK BL 


int putchar(int) 


用 于 输出 数据 。putchar(c) 将 字符 c 送 至 标准 输出 上 ， 在 默认 情况 下 ， 标 
准 输出 为 屏幕 显 示 。 如 果 没 有 发 生 错 误 ， 则 函数 putchar 将 返 同 输出 的 
字符 ;如 果 发 生 了 错误 ， 则 返回 EOF。 同样 ， 通 常情 况 下 ， 也 可 以 使 
用 “ > 输出 文件 名 " 的 格式 将 输出 旱 定 同 到 攻 个 文件 中 。 例如 ， 如 果 程 
序 prog 调用 了 函数 putchar， 那 么 命令 行 


prog > 输出 文件 名 


将 把 程序 prog 的 输出 从 标准 输出 设备 重 定 癌 到 文件 中 。 如 果 系 统 文 持 
管道 ， 那 么 命令 行 








prog | anotherprog 


将 把 程序 prog 的 输出 从 标准 输出 通过 管道 重 定 同 到 程序 anotherprog 的 
标准 输入 中 。 函数 printf 也 问 标 准 输出 设备 上 输出 数据 。 我 们 在 程序 中 
可 以 交叉 调用 函数 putchar 


和 printf， 输 出 将 按照 函数 调用 的 先后 顺序 依次 产生 。 


eee 函数 的 每 个 源 程序 文件 必须 在 引用 这 些 函 数 之 前 包 台 
下 列 语 


#include <stdio.h> 


SEA AOR SMREK, POU as CE HA SE SCAN 
有 关 位 置 中 查找 指定 的 文件 (例如 ， 在 UNIX 系统 中 ， 文 件 一 般 放 在 目 
录 /usr/include 中 )。 


许多 程序 只 从 个 输入 流 中 读 取 数 据 ， 并 且 只 同一 个 输出 法 中 输出 数 

据 。 对 于 这 样 的 程序 ， 只 需要 使 用 函数 getchar, putchar 和 printf 实现 
输入 /输出 即 可 ， 并 且 对 程序 来 说 已 经 足够 了 。 特 别 是 ， 如 果 通 过 重 定 
问 将 一 个 程序 的 输出 连接 到 另 一 个 程序 的 输入 ， 仅 仅 使 用 这 些 函 数 就 
Sie 例如 ， 考 虑 下 列 程序 lower， 它 用 于 将 输入 转换 为 小 写字 母 的 
AIX: 


#include <stdio.h> 


m 

















#include <ctype.h> 
main() /* lower: convert input to lower case*/ 


{ 

int c 

while ((c = getchar()) != EOF) putchar(tolower(c)); 

return 0; 

} 

函数 tolower 在 头 文件 <ctype.h> 中 定义 ， 它 把 大 写字 母 转换 为 小 写 形 
式 ， 并 把 其 它 字符 原样 返回 。 我 们 在 前 面 提 到 过 ， 头 文件 <stdio.h> 中 的 
getchar 和 putchar" 函 数 ” 以 及 <ctype.h> 中 的 ”tolower" 函 数 "一 般 都 是 

宏 ， 这 样 加 避免 了 对 每 个 字符 都 进行 函数 调 用 的 开销 。 我 们 将 在 8.5 1 
介绍 它们 的 实现 方法 。 无 论 <ctype.h> 中 的 函数 在 给 定 的 机 器 上 是 如 何 
实现 的 ， 使 用 这 些 函 数 的 程序 都 不 必 了 解 字符 集 的 知识 。 

练习 71 编写 一 个 程序 ， 根 据 它 目 身 被 调 用 时 存放 在 argv[0] 中 的 
名 字 ， 实 现 将 大 写字 母 转换 为 小 写字 母 或 将 小 写字 母 转换 为 大 写字 母 
的 功能 。 

7.2 格式 化 输出 一 一 printf 函数 


输出 函数 printf 将 内 部 数值 转换 为 字符 的 形式 。 前 面 的 有 关 章 市 中 已 经 
使 用 过 该 函数 。 

















下 面 只 讲述 该 函数 最 典型 的 用 法 ， 附 录 也 中 给 出 了 该 函数 完整 的 描述 。 
int printf(char *format, arg1, arg2, ...); 


函数 printf 在 输出 格式 format 的 控制 下 ， 将 其 参数 进行 转换 与 格式 化 ， 
并 在 标准 输出 设 备 上 打印 出 来 。 它 的 返回 值 为 打印 的 字符 数 。 
格式 字符 串 包 含 两 种 类 型 的 对 象 :普通 字符 和 转换 说 明 。 在 输出 时 ， 普 
通 字符 将 原样 不 动 地 复制 到 输出 流 中 ， 而 转换 说 明 并 不 直接 输出 到 输 
出 流 中 ， 而 是 用 于 控制 printf 中 参数 的 转换 和 打印 ， 每 个 转换 说 明 都 由 
一 个 百 分 写 字符 ( 即 %) 开 始 ， 并 以 一 个 转换 字符 结束 。 在 字符 % 和 转换 
字符 中 间 可 能 依次 包含 下 列 组 成 部 分 : 

负 号 ， 用 于 指定 被 转换 的 参数 按照 左 对 齐 的 形式 输出 。 

数 ， 用 于 指定 最 小 字段 宽度 。 转 换 后 的 参数 将 打印 不 小 于 最 小 
字段 宽度 的 字段 。 如 果 有 必要 ， 字 段 左 边 ( 如 果 使 用 左 对 齐 的 方式 ， 则 
为 右边 ) 多 余 的 字符 位 置 用 空格 
填充 以 保证 最 小 字段 宽 。 

小 数 点 ， 用 于 将 字段 宽度 和 精度 分 开 。 


数 ， 用 于 指定 精度 ， 即 指定 字符 串 中 要 打印 的 最 大 字符 数 、 浮 
点 数 小 数 点 后 的 位 数 、 整 型 最 少 输出 的 数字 数目 。 


字母 hn 或 1 字母 hn 表 不 将 整数 作为 short 类 型 打印 ， 字 母 1 表 
示 将 整数 作为 long 


类 型 打印 。 


表 7"1 列 出 了 所 有 的 转换 字符 ， 如 果 % 后 面 的 字符 不 是 一 个 转换 说 明 ， 
则 该 行为 是 未 定义 的 。 


K 791 printf 函数 基本 的 转换 说 明 


























符 参数 类 型 :输出 形式 


"int 类 型 ;十 进 制 数 
int 类 型 ;无 符 写 八 进 制 数 (没有 前 导 0) 


“x int 类 型 ;无 符号 十 六 进 制 数 (没有 前 导 Ox BK OX), 10015 分 别 用 
abcdef 或 ABCDEF 表示 


int 类 型 ;无 符号 十 进 制 数 
int 类 型 ;单个 字符 
char* 类 型 ;顺序 打印 字符 串 中 的 字符 ， 直 到 遇 到 \0' 或 已 打印 了 由 精 


度 指定 的 字符 数 为 止 ' double 类 型 ;十 进 制 小 数 ["]m.dddddd， 其 中 d 的 
个 数 由 精度 指定 (默认 值 为 6) 





©® double 28 4!;[*]m.dddddd e +xx 或 [ejm.dddddd E +txx， 其 中 d 的 个 数 
由 精度 指定 (默认 值 为 6) 


“5 double 类 型 ;如 果 指 数 小 于 "4 或 大 于 等 于 精度 ， 则 用 %e 或 %E 格式 
fart, AHHA 格式 输出 。 尾 部 的 0 和 小 数 点 不 打印 


"” void * 类 型 ;指针 (取决 于 具体 实现 ) 


不 转换 参数 ;打印 一 个 百 分 写 % 


在 转换 说 明 中 ， 宽 上 度 或 精度 可 以 用 星 号 * 表 示 ， 这 时 ， 宽 上 度 或 精度 的 值 
通过 转换 下 一 参数 (必须 为 int 类 型 ) 来 计算 。 例 如 ， 为 了 从 字符 串 s 中 
打印 最 多 max 个 字符 ， 可 以 使 用 下 列 语句 : 





printf(""%.*s", max, s); 


前 面 的 章节 中 已经 介绍 过 大 部 分 的 格式 转换 ， 但 没有 介绍 与 字符 串 相 关 
的 精度 。 下 表 说 明了 在 打印 字符 串 "hello, world"(12 个 字符 ) 时 根据 不 同 
的 转换 说 明 产 生 的 不 同 结果 。 我 们 在 每 个 字段 的 左边 和 右边 加 上 时 
号 ， 这 样 可 以 清晰 地 表示 出 字段 的 宽度 。 


:%s: :hello, world: 


:%10s: :hello, world: 

:%.10s: :hello, wor: 

:920。10S: :hello, world: 

:%.15s: :hello, world: 

:20。155S: :hello, world 
:%15.10s: : hello, wor: 
:%°15.10s: :hello, wor 


注意 :函数 printf 使 用 第 一 个 参数 判断 后 面 参数 的 个 数 及 类 型 。 如 果 参 数 
的 个 数 不 够 或 者 类 型 错误 ， 则 将 得 到 错误 的 结果 。 请 注意 下 面 两 个 函 
数 调用 之 间 的 区 列 : 


printf(s); /* FAILS if s contains % */ printf("%s", s); 
/* SAFE */ 








PS AY 


aes sprintf 执行 的 转换 和 函数 printf 相同 ， 但 它 将 输出 保存 到 一 个 字符 


int sprintf(char *string, char *format, arg1, arg2, ...); sprintf 函数 和 printf PI 
数 一 样 ， 按 照 format 格式 格式 化 参数 序列 argl1、arg2、 ， 


但 它 将 输出 结果 存放 到 string 中 ， 而 不 是 输出 到 标准 输出 中 。 当 然 ， 
string 必须 足够 大 以 
存放 输出 结果 。 


练习 7*2 编写 一 个 程序 ， 以 合理 的 方式 打印 任何 输入 。 该 程序 至 少 能 够 
根据 用 户 的 习惯 以 八进制 或 十 六 进 制 打印 非 图 形 字 符 ， 并 截断 长 文本 
行 。 


7.3 变 长 参数 表 


本 节 以 实现 函数 printf 的 一 个 最 简单 版 本 为 例 ， 介 绍 如 何以 可 移植 的 方 
式 编写 可 处 理 变 长 参数 表 的 函数 。 因 为 我 们 的 重点 在 于 参数 的 处 理 ， 
HLA, PRA minprintf 只 处 理 格式 字 符 串 和 参数 ， 格 式 转换 则 通过 调用 
函数 printf 实现 。 


函数 printf 的 正确 声明 形式 为 : 





int printf(char *fmt, ...) 
其 中 ， 省 略 号 表示 参数 表 中 参数 的 数量 和 类 型 是 可 变 的 。 省 略 号 只 能 出 


现在 参数 表 的 尾部 。 因为 minprintf 函数 不 需要 像 printf 函数 一 样 返回 
实际 输出 的 字符 数 ， 因 此 ， 我 们 将 它 声明 为 下 列 形式 : 








void minprintf(char *fmt, ...) 


编写 函数 minprintf 的 关键 在 于 如 何 处 理 一 个 甚至 连 名 字 都 没有 的 参数 
表 。 标 准 头 文件 


<stdarg.h) 中 包含 一 组 宏 定义 ， 它 们 对 如 何人 遍历 参数 表 进 行 了 定义 。 该 头 
文件 的 实现 因 不 


同 的 机 器 而 不 同 ， 但 提供 的 接口 是 一 致 的 。 


va_list 类 型 用 于 声明 一 个 变量 ， 该 变量 将 依次 引用 各 参数 。 在 函数 
minprintf F, 我 们 将 该 变量 称 为 ap， 意 思 是 "参数 指针 "。 宏 va_start 将 
ap 初始 化 为 指 癌 第 一 个 无 名 参 数 的 指针 。 在 使 用 ap 之 前 ， 该 宏 必 须 被 
调用 一 次 。 参 数 表 必 须 至 少 包 括 一 个 有 名 参数 ， va_start 将 最 后 一 个 有 
名 参数 作为 起 点 。 


每 次 调用 va_arg， 该 函数 都 将 返回 一 个 参数 ， 并 将 ap 指 癌 下 一 个 参 
数 。va_arg 使 用 一 个 类 型 名 来 决定 返回 的 对 象 类 型 、 指 针 移 动 的 步 
长 。 最 后 ， 必 须 在 函数 返回 之 前 调用 va_end， 以 完成 一 些 必要 的 清理 工 
E 








基于 上 面 这 些 讨论 ， 我 们 实现 的 简化 printf 函数 如 下 所 示 : 
#include <stdarg.h> 


/* minprintf: minimal printf with variable argument list */ void 
minprintf(char *fmt, ...) 


{ 
va_list ap; /* points to each unnamed arg in turn */ char *p, *sval; 
int ival; double dval; 


va_start(ap, fmt); /* make ap point to 1st unnamed arg */ for (p = fmt; *p; 
p++) { 


if (*p != '%') { putchar(*p); continue; 

} 

switch (*++p) { case 'd': 

ival = va_arg(ap, int); printf("%d", ival); break; 
case 'f': 

dval = va_arg(ap, double); printf("%f", dval); 
break; case 's': 

for (sval = va_arg(ap, char *); *sval; sval++) putchar(*sval); 
break; default: 

putchar(*p); break; 

} 

} 


va_end(ap); /* clean up when done */ 


} 

练习 793 改写 minprintf 函数 ， 使 它 能 完成 printf 函数 的 更 多 功 
能 。 

7.4 格式 化 输入 scanf 函数 





输入 函数 scanf 对 应 于 输出 函数 printf， 它 在 与 后 者 相反 的 方向 上 提供 同 
样 的 转换 功能。 具有 变 长 参数 表 的 函数 scanf 的 声明 形式 如 下 : 


int scanf(char *format, ...) 


scanf 国 数 从 标准 输入 中 读 取 字 符 序 列 ， 按 照 format 中 的 格式 说 明 对 字 
符 序 列 进 行 解释 ， 并 把 结果 保存 到 其 余 的 参数 中 。 格 式 参 数 format 将 
在 接 下 来 的 内 容 中 进行 讨论 。 其 它 所 有 参数 都 必须 是 指针 ， 用 于 指定 
经 格式 转换 后 的 相应 输入 保存 的 位 置 。 和 上 节 讲 述 printf 一 FR, ASA 
介绍 scanf 函数 最 有 用 的 一 些 特征 ， 而 并 不 完整 地 介绍 。 


当 scanf 函数 扫描 完 其 格式 串 ， 或 者 碰 到 东 些 输入 无 法 与 格式 控制 说 明 
匹配 的 情况 时 ， 该 函数 将 终止 ， 同 时 ， 成 功 匹 配 并 赋值 的 输入 页 的 个 
数 将 作为 函数 值 返回 ， 所 以 ， 该 函数 的 


返回 值 可 以 用 来 确定 已 死 配 的 输入 页 的 个 数 。 如 条 到 达 文 件 的 结尾 ， 该 
函数 将 返回 EOF. YE 意 ， 返 回 EOF 与 0 是 不 同 的 ，0 表示 下 一 个 输入 
字符 与 格式 串 中 的 第 一 个 格式 说 明 不 匹配 。 下 一 次 调用 scanf 函数 将 从 
上 一 次 转换 的 最 后 一 个 字符 的 下 一 个 字符 开始 继续 搜索 。 


另外 还 有 一 个 输入 函数 ”sscanf， 它 用 于 从 一 个 字符 串 (而 不 是 标准 输入 ) 
中 读 取 字符 序 列 : 








int sscanf(char *string, char *format, arg1, arg2, ...) 


它 按照 格式 参数 format 中 规定 的 格式 扫 摘 字符 串 string， 并 把 结果 分 别 
保存 到 argi, arg2、 这 些 参数 中 。 这 些 参数 必须 是 指针 。 


格式 串通 常 都 包含 转换 说 明 ， 用 于 控制 输入 的 转换 。 格 式 串 可 能 包含 下 


列 部 分 : 





空格 或 制 表 符 ， 在 处 理 过 程 中 将 被 忽略 。 
普通 字符 (不 包括 %)， 用 于 匹配 输入 流 中 下 一 个 非 空白 符 字 


转换 说 明 ， 依 次 由 一 个 %、 一 个 可 选 的 赋值 禁止 字符 *、 一 个 
可 选 的 数值 (指定 最 大 字段 宽度 )、 一 个 可 选 的 h、1 或 L 字符 (指定 目标 
对 象 的 宽度 ) 以 及 一 个 转换 字符 


组 成 。 


转换 说 明 控 制 下 一 个 输入 字段 的 转换 。 一 般 来 说 ， 转 换 结果 存放 在 相应 
的 参数 指 同 的 变 量 中 。 但 是 ， 如 果 转 换 说 明 中 有 赋值 茶 止 字符 *， 则 跳 
过 该 输入 字段 ， 不 进行 赋值 。 输 入 字段 定义 为 一 个 不 包括 空白 符 的 字 
符 串 ， 其 边界 定义 为 到 下 一 个 空白 符 或 达到 指定 的 字段 宫 度 。 这 表明 
scanf 图 数 将 越过 行 边界 读 取 输 入， 因为 换行 符 也 是 空 日 符 。( 空 日 符 包 
括 空格 符 、 横 向 制 表 符 、 换 行 符 、 回 车 符 、 纵 向 制 表 符 以 及 换 页 符 )。 


转换 字符 指定 对 输入 字段 的 解释 。 对 应 的 参数 必须 是 指针 ， 这 也 是 C 语 
言 通 过 值 调用 语 义 所 要 求 的 。 表 792 中 列 出 了 这 些 转换 字符 。 


K 7。2 scanf 函数 的 基本 转换 说 明 

















符 输入 数据 ;参数 类 型 
十 进 制 整数 ;int * 类 型 

整数 ;int * 类 型 ， 可 以 是 八进制 (以 0 开头 ) 或 十 六 进 制 ( 以 Ox BK OX FF 
SK) 

八进制 整数 (可 以 以 0 开头 ， 也 可 以 不 以 0 开头 );int * 类 型 

无 符号 十 进 制 整数 ;unsigned int * 类 型 


十 六 进 制 整数 (可 以 0x BK OX 开头 ， 也 可 以 不 以 0x 或 0X 开头 );int * 
类 J 
字符 ;char * 类 型 ， 将 接 下 来 的 多 个 输入 字符 (默认 为 1 个 字符 ) 存 放 
到 指定 位 置 。 该 转换 规范 通常 不 跳 过 空白 符 。 如 果 需 要 读 入 下 一 个 非 
空白 符 ， 可 以 使 用 %1s 


”字符 囊 (不 加 引号 );char * 类 型 ， 指 向 一 个 足以 存放 该 字符 串 (还 包括 
尾部 的 字符 \0) 的 字符 数组 。 字 符 串 的 末尾 将 被 添加 一 个 结束 符 \0 


cte 浮 点 数 ， 它 可 以 包括 正 负 号 (可 选 )、 小 数 点 (可 选 ) 及 指数 部 分 (可 
选 );float ”* 类 型 


字符 %; 不 进行 任何 赋值 操作 


转换 说 明 d、i、o、u 及 x 的 前 面 可 以 加 上 字符 h 或 1。 前 级 h 表明 参数 
表 的 相应 参数 是 一 个 指 同 short 类 型 而 非 int 类 型 的 指针 ， 前 级 1 表明 参 
数 表 的 相应 参数 是 一 个 指 同 long 类 型 的 指针 。 类 似 地 ， 转 换 说 明 e、f 
FU g 的 前 面 也 可 以 加 上 前 级 1， 它 表明 参数 表 的 相应 参 数 是 一 个 指 问 
double 类 型 而 非 float 类 型 的 指针 。 


来 看 第 一 个 例子 。 我 们 通过 函数 scant 执行 输入 转换 来 改写 第 4 章 中 的 
简单 计算 器 程序 ， 


如 下 所 示 : 

#include <stdio.h> 

main() /* rudimentary calculator */ 
{ 

double sum, v; 

sum = 0; 


while (scanf("%lf", &v) == 1) printf("\t%.2f\n", sum += v); 


return 0; 

} 

假设 我 们 要 读 取 包含 下 列 日 期 格式 的 输入 行 : 
25 Dec 1988 


相应 的 scanf 语句 可 以 这 样 编写 : 

int day, year; 

char monthname[20]; 

scanf("%d %s %d", &day, monthname, &year); 

因为 数组 名 本 身 就 是 指针 ， 所 以 ，monthname 的 前 面 没 有 取 地 址 运算 符 
&o 字符 字面 值 也 可 以 出 现在 scanf 的 格式 串 中 ， 它 们 必须 与 输入 中 相 
同 的 字符 匹配 。 因 此 ， 

我 们 可 以 使 用 下 列 scanf 语句 读 入 形 如 mm/dd/yy 的 日 期 数据 : 

int day, month, year; 


scanf("%d/%d/%d", &month, &day, &year); 


scanf 函数 忽略 格式 串 中 的 空格 和 制 表 符 。 此 外 ， 在 读 取 输入 值 时 ， 它 
将 跳 过 空白 符 ( 空 格 、 制 表 符 、 换 行 符 等 等 )。 如 果 要 读 取 格式 不 固定 的 
输入 ， 最 好 每 次 读 入 一 行 ， 然 后 再 用 sscanf 将 合适 的 格式 分 离 出 来 读 

入 。 例 如 ， 假 定 我 们 需要 读 取 一 些 包含 日 期 数据 的 输入 行 ， 日 期 的 格 

式 可 能 是 上 述 任 一 种 形式 。 我 们 可 以 这 样 编写 程序 : 





while (getline(line, sizeof(line)) > 0) { 


if (sscanf(line, "%d %s %d", &day, monthname, &year) == 3) printf("valid: 
%s\n", line); /* 25 Dec 1988 form */ 


else if (sscanf(line, "%d/%d/%d", &month, &day, &year) == 3) printf("valid: 
%s\n", line); /* mm/dd/yy form */ 


else 

printf("invalid: %s\n", line); /* invalid form */ 

} 

scanf 函数 可 以 和 其 它 输入 函数 混合 使 用 。 无 论调 用 哪个 输入 函数 ， 下 
z 站 输入 函数 的 调用 将 从 scanf 没有 读 取 的 第 一 个 字符 处 开始 读 取 数 


注意 ，scanf 和 sscanf 函数 的 所 有 参数 都 必须 是 指针 。 最 常见 的 错误 是 
将 输入 语句 写 成 下 列 形式 : 


scanf("%d", n); 
正确 的 形式 应 该 为 : 


scanf("%d", &n); 


编译 器 在 编译 时 一 般 检 测 不 到 这 类 错误 。 


误 
练习 7*4 类 似 于 上 一 节 中 的 函数 minprintf， 编 写 scanf 函数 的 一 
个 简化 版 本 。 练习 7*5 改写 第 4 章 中 的 后 缀 计算 器 程序 ， 用 
scanf 函数 和 (或 )sscanf 函数 实 


现 输入 以 及 数 的 转换 。 
7.5 文件 访问 


到 目前 为 止 ， 我 们 讨论 的 例子 都 是 从 标准 输入 读 取 数据 ， 并 癌 标 准 和 输出 
输出 数据 。 标 准 输入 和 标准 输出 是 操作 系统 自动 提供 给 程序 访问 的 。 


接 下 来 ， 我 们 编写 一 个 访问 文件 的 程序 ， 且 它 所 访问 的 文件 还 没有 连接 
到 该 程序 。 程 序 cat 可 以 用 来 说 明 该 问题 ， 它 把 一 批 命名 文件 串联 后 输 
出 到 标准 输出 上 。cat 可 用 来 在 屏幕 上 打印 文件 ， 对 于 那些 无 法 通过 名 
字 访 问 文件 的 程序 来 说 。 它 还 可 以 用 作 通 用 的 输入 收集 器 。 例如， 下 


列 命 令 行 : 
cat X.C y.c 


将 在 标准 输出 上 打印 文件 x.c 和 y.c 的 内 容 。 问题 在 于 ， 如 何 设计 命名 
文件 的 读 取 过 程 昵 ? 换 句 话说 ， 如 何 将 用 户 需 要 使 用 的 文件 的 


外 部 名 同 读 取 数据 的 语句 关联 起 来 。 


方法 其 实 很 简单 。 在 读 写 一 个 文件 之 前 ， 必 须 通过 库 函 数 fopen 打开 该 
文件 。fopen 用 类 似 于 xc 或 yc 这 样 的 外 部 名 与 操作 系统 进行 某 些 必要 
的 连接 和 通信 (我 们 不 必 关 心 这 些 细节 )， 并 返回 一 个 随后 可 以 用 于 文件 
读 写 操作 的 指针 。 


该 指针 称 为 文件 指针 ， 它 指向 一 个 包含 文件 信息 的 结构 ， 这 些 信息 包 
括 :缓冲 区 的 位 置 、 绥 冲 区 中 当前 字符 的 位 置 、 文 件 的 读 或 写 状态 、 是 
个 出 错 或 是 人 否 已 经 到 达 文 件 结尾 等 等 。 用 尸 不 必 关 心 这 些 细节 ， 因 为 
<stdio.h> 中 已 经 定义 了 一 个 包含 这 些 信息 的 结构 FILE。 在 程序 中 内需 
按照 下 列 方式 声明 一 个 文件 指针 即 可 : 


FILE *fp; 
FILE *fopen(char *name, char *mode); 


CEA PIA, fp 是 一 个 指向 结构 FILE 的 指针 ， 并 且 ，fopen 函数 返回 一 
个 指向 结构 FILE 的 指针。 注意 ，EFILE 像 int 一 样 是 一 个 类 型 名 ， 而 不 
是 结构 标记 。 它 是 通过 typedef 定义 的 (UNIX 系统 中 fopen 的 实现 细节 
将 在 8.5 市 中 讨论 )。 


在 程序 中 ， 可 以 这 样 调用 fopen 函数 : 








fp = fopen(name, mode); 


fopen 的 第 一 个 参数 是 一 个 字符 串 ， 它 包含 文件 名 。 第 二 个 参数 是 访问 
模式 ， 也 是 一 个 字符 串 ， 用 于 指定 文件 的 使 用 方式 。 人 允许 的 模式 包括 : 
CE Sw") ABI a"). FEES 系统 还 区 分 文本 文件 和 二 进 制 文 
件 ， 对 后 者 的 访问 需要 在 模式 字符 串 中 增加 字符 “b"。 


如 果 打 开 一 个 不 存在 的 文件 用 于 写 或 人 妃 加 ， 该 文件 将 被 创建 (如 果 可 能 
的 话 )。 当 以 写 方 式 打 开 一 个 已 存在 的 文件 时 ， 该 文件 原来 的 内 容 将 被 
履 盖 。 但 是 ， 如 果 以 追加 方式 打开 一 个 文件 ， 则 该 文件 原来 的 内 容 将 
保留 不 变 。 读 一 个 不 存在 的 文件 会 导致 错误 ， 其 它 一些 操 作 也 可 能 导 
致 错误 ， 比 如 试图 读 取 一 个 无 读 取 权 限 的 文件 。 如 果 发 生 错误 ，fopen 
将 返回 NULL. 














(可 以 更 进一步 地 定位 错误 的 类 型 ， 具 体 方法 请 参见 附录 B.1 市 中 关于 
错误 处 理 函 数 的 讨论 。) 


文件 被 打开 后 ， 就 需要 考虑 采用 哪 种 方法 对 文件 进行 读 写 。 有 多 种 方法 
可 供 考 虑 ， 其 中 ， gete 和 pute 函数 最 为 简单 。getc 从 文件 中 返回 下 一 
个 字符 ， 它 需要 知道 文件 指针 ， 以 确 定 对 哪个 文件 执行 操作 : 


int getc(FILE *fp) 


getc 函数 返回 fp 指 回 的 输入 流 中 的 下 一 个 字符 。 如 果 到 达 文 件 尾 或 出 
现 错误 ， 该 函数 将 返 El EOF, 


pute 是 一 个 输出 函数 ， 如 下 所 示 : 
int putc(int c, FILE *fp) 


该 函数 将 字符 c SAS] fp 指 同 的 文件 中 ， 并 返回 写 入 的 字符 。 如 果 发 
生 错 误 ， 则 返回 EOF. 类 似 于 getchar 和 putchar，getc 和 pute 是 宏 而 
不 是 函数 。 


启动 一 个 C 语言 程序 时 ， 操 作 系 统 环境 负责 打开 3 个 文件 ， 并 将 这 3 个 
文件 的 指 针 提 供 给 该 程序 。 这 3 个 文件 分 别 是 标准 输入 、 标 准 输 出 和 
标准 错误 ， 相 应 的 文件 指针 分 别 为 stdin, stdout 和 stderr， 它 们 在 
<stdio.h> 中 声明 。 在 大 多 数 环境 中 ，stdin 指向 键盘 ， 而 stdout 和 stderr 
指 同 显示 器 。 我 们 从 7.1 节 的 讨论 中 可 以 知道 ，stdin 和 stdout 可 以 被 重 
定 回 到 文件 或 管道 。 


getchar 和 putchar 函数 可 以 通过 getc. putec, stdin 及 stdout 定义 如 下 : 











#define getchar() getc(stdin) 

#define putchar(c) putc((c), stdout) 

对 于 文件 的 格式 化 输入 或 输出 ， 可 以 使 用 函数 fscanf 和 fprintf。 它 们 与 
scanf 和 printf 函数 的 区 别 仅仅 在 于 它们 的 第 一 个 参数 是 一 个 指 癌 所 要 读 
写 的 文件 的 指针 ， 第 二 个 参 数 是 格式 串 。 如 下 所 示 : 


int fscanf(FILE *fp, char *format, ...) int fprintf(FILE *fp, char *format, ...) 


掌握 这 些 预备 知识 之 后 ， 我 们 现在 就 可 以 编写 出 将 多 个 文件 连接 起 来 的 
cat 程序 了 。 该 程序 的 设计 思路 和 其 它 许多 程序 类 似 。 如 果 有 命令 行 参 
数 ， 参 数 将 被 解释 为 文件 名 ， 并 按 顺 序 逐 个 处 理 。 如 条 没有 参数 ， 则 
处 理 标准 输入 。 

#include <stdio.h> 

/* cat: concatenate files, version 1 */ main(int argc, char *argv[]) 

{ 

FILE *fp; 

void filecopy(FILE *, FILE *) 

if (argc == 1) /* no args; copy standard input */ filecopy(stdin, stdout); 

else 

while(**argc > 0) 


if ((fp = fopen(*++argv, "r")) == NULL) { printf("cat: can't open %s\n, 
*argv); return 1; 


} else { 


filecopy(fp, stdout); fclose(fp); 
} 


return 0; 


} 


/* filecopy: copy file ifp to file ofp */ void filecopy(FILE *ifp, FILE 
*ofp) 


{ 

int c; 

while ((c = getc(ifp)) != EOF) putc(c, ofp); 
} 


文件 指针 stdin 与 stdout 都 是 FILE * 类 型 的 对 象 。 但 它们 是 常量 ， 而 非 
变量 。 因 此 不 能 对 它们 赋值 。 


函数 
int fclose(FILE *fp) 


执行 和 fopen 相反 的 操作 ， 它 断 开 由 fopen 函数 建立 的 文件 指针 和 外 部 
名 之 间 的 连接 ， 并 释放 文件 指针 以 供 其 它 文 件 使 用 。 因 为 大 多 数 操作 
系统 都 限制 了 一 个 程序 可 以 同时 打开 的 文 件数 ， 所 以 ， 当 文件 指针 不 
再 需要 时 就 应 该 释放 ， 这 是 一 个 好 的 编程 习惯 ， 惑 像 我 们 在 cat 程序 中 
所 做 的 那样 。 对 输出 文件 执行 fclose 还 有 另外 一 个 原因 : 它 将 把 缓冲 区 中 
由 pute 函数 正在 收集 的 输出 写 到 文件 中 。 当 程序 正常 终 目 时， 程序 会 
自动 为 每 个 打开 的 文件 调用 fclose 函数 。( 如 果 不 需 要 使 用 stdin 与 
rae ADE MRA. thay Wie ee ek Ae freopen 重新 指定 它 

MJ. ) 


7.6 错误 处 理 














stderr 和 exit 


cat 程序 的 错误 处 理 功能 并 不 完善 。 问 题 在 于 ， 如 果 因 为 东 种 原因 而 造 
成 其 中 的 一 个 文 件 无 法 访问 ， 相 应 的 诊断 信息 要 在 该 连接 的 输出 的 末 
尾 才能 打印 出 来 。 当 输出 到 屏幕 时 ， 这 种 处 理 方法 尚 可 以 接受 ， 但 如 
果 输 出 到 一 个 文件 或 通过 管道 输出 到 男 一 个 程序 时 ， 就 无 法 接 受 了 。 


为 了 更 好 地 处 理 这 种 情况 ， 男 一 个 输出 流 以 与 stdin 和 stdout 相同 的 方 
式 分 派 给 程序 ， 即 stderr。 即 使 对 标准 输出 进行 了 重 定 同 ， 写 到 stderr 
中 的 输出 通常 也 会 显示 在 屏幕 上 。 

下 面 我 们 改写 cat 程序 ， 将 其 出 错 信息 写 到 标准 错误 文件 上 。 


#include <stdio.h> 





/* cat: concatenate files, version 2 */ main(int argc, char *argv[]) 
{ 

FILE *fp; 

void filecopy(FILE *, FILE *); 

char *prog = argv[0]; /* program name for errors */ 


if (argc == 1 ) /* no args; copy standard input */ filecopy(stdin, stdout); 


else 
while (**argc > 0) 


if ((fp = fopen(*++argv, "r")) == NULL) { fprintf(stderr, "%s: can't open 
%s\n", 


prog, *argv); exit(1); 

yelse { 

filecopy(fp, stdout); fclose(fp); 

} 

if (ferror(stdout)) { 

fprintf(stderr, "%s: error writing stdout\n", prog); exit(2); 

} 

exit(0); 

} 

该 程序 通过 两 种 方式 发 出 出 错 信息 。 首 先 ， 将 fprintf 函数 产生 的 诊断 信 
轧 输 出 到 stderr 上 ， 因 此 诊断 信息 将 会 显示 在 屏幕 上 ， 而 不 是 仅仅 输出 
到 管道 或 输出 文件 中 。 诊 断 信 ARa S argv[0] 中 的 程序 名 ， 因 此 ， 当 
该 程序 和 其 它 程序 一 起 运行 时 ， 可 以 识别 错误 的 来 源 。 

其 次 ， 程 序 使 用 了 标准 库 函 数 exit， 当 该 函数 被 调用 时 ， 它 将 终止 调用 
程序 的 执行 。 任 何 调用 该 程序 的 进程 都 可 以 获取 exit 的 参数 值 ， 因 
此 ， 可 通过 另 一 个 将 该 程序 作为 子 进 程 的 程序 来 测试 该 程序 的 执行 是 
否 成 功 。 按 照 惯例 ， 返 回 值 0 表示 一 切 正常 ， 而 非 0 返回 值 通常 表示 
EI SRA TL. exit 为 每 个 已 打开 的 输出 文件 调用 fclose 函数 ， 以 将 
Belt XA AY ir 有 输出 写 到 相应 的 文件 中 。 


在 主 程序 main 中 ， 语 句 return expr 等 价 于 exit(expmD。 但 是 ， 使 用 函数 











exit 有 一 个 优点 ， 它 可 以 从 其 它 函 数 中 调用 ， 并 且 可 以 用 类 似 于 第 5 Be 
中 描述 的 模式 碍 找 程序 得 找 这 些 调用 。 


如 果 流 印 中 出 现 错误 ， 则 函数 ferror 返回 一 个 非 0 值 。 
int ferror(FILE *fp) 


尽管 输出 错误 很 少 出现 ， 但 还 是 存在 的 (例如 ， 当 磁盘 满 时 )， 因 此 ， 成 
熟 的 产品 程序 应 该 检 查 这 种 类 型 的 错误 。 


函数 ee *) 与 ferror 类 似 。 如 果 指 定 的 文件 到 达 文 件 结尾 ， 它 将 返 
回 一 


0 值 。 
int feof(FILE *fp) 
在 上 面 的 小 程序 中 ， 我 们 的 目的 是 为 了 说 明 问 题 ， 因 此 并 不 太 关 心 程序 


的 退出 状态 ， 但 对 于 任何 重要 的 程序 来 说 ， 都 应 该 让 程序 返回 有 意义 
且 有 用 的 值 。 


7.7 行 输 入 和 行 输出 
标准 库 提供 了 一 个 输入 函数 fgets， 它 和 前 面 几 章 中 用 到 的 函数 getline 


类 似 。 








char *fgets(char *line, int maxline, FILE *fp) 


fgets BUA fp 指 问 的 文件 中 读 取 下 一 个 输入 行 (包括 换行 行 )， 并 将 它 
存放 在 字符 数组 








line 中 ， 它 最 多 可 读 取 maxlines1 个 字符 。 读 取 的 行将 以 \0' 结 尾 保存 到 
数组 中 。 通 常情 ULE, fgets 返回 line， 但 如 果 遇 到 了 文件 结尾 或 发 生 了 
错误 ， 则 返回 NULL( 我 们 编写 的 getline 函数 返回 行 的 长 度 ， 这 个 值 更 
有 用 ， 当 它 为 0 时 意味 着 已 经 到 达 了 文件 的 结尾 )。 


输出 函数 fputs 将 一 个 字符 串 ( 不 需要 包含 换行 符 ) 写 入 到 一 个 文件 中 : 
int fputs(char *line, FILE *fp) 
如 果 发 生 错 误 ， 该 函数 将 返回 EOF， 否 则 返回 一 个 非 负 值 。 
库 函 数 gets 和 puts 的 功能 与 fgets 和 fputs 函数 类 似 ， 但 它们 是 对 stdin 
和 stdout 进行 操作 。 有 一 点 我 们 需要 注意 ，gets 函数 在 读 取 字符 串 时 将 
删除 结尾 的 换行 符 (\n)， 而 puts 函数 在 写 入 字符 串 时 将 在 结尾 添加 一 
人 At 
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下 面 的 代码 是 标准 库 中 fgets 和 fputs 函数 的 代码 ， 从 中 可 以 看 出 ， 这 两 
个 函数 并 没 有 什么 特别 的 地 方 。 代 码 如 下 所 示 : 





/* fgets: get at most n chars from iop */ char *fgets(char *s, int n, 
FILE *iop) 


{ 

register int c; register char *cs; 

CS = sS; 

while (een > 0 && (c = getc(iop)) != EOF) if ((*cs++ = c) == ‘\n’) 
break; 

*cs = '\0'; 

return (c == EOF && cs == s) ? NULL: s; 


} 


/* fputs: put string s on file iop */ int fputs(char *s, FILE *iop) 
{ 

int c; 

while (c = *s++) putc(c, iop); 

return ferror(iop) ? EOF : 0; 

} 


ANSI 标准 规定 ，ferror 在 发 生 错 误 时 返回 非 0 值 ， 而 fputs 在 发 生 错 误 
时 返回 EOF, 其 它 情况 返回 一 个 非 负 值 。 


使 用 fgets 函数 很 容易 实现 getline 函数 : 





/* getline: read a line, return length */ int getline(char *line, int max) 
{ 

if (fgets(line, max, stdin) == NULL) return 0; 

else 

return strlen(line); 

} 


AATE 。 编写 一 个 程序 ， 比 较 两 个 文件 并 打印 它们 第 一 个 不 相同 
ME 








练习 7*7 修改 第 5 章 的 模式 碍 找 程 序 ， 使 它 从 一 个 命名 文件 的 集合 中 读 
取 输 入 (有 文 件 名 参数 时 )， 如 果 没 有 文件 名 参数 ， 则 从 标准 输入 中 读 取 
输入 。 当 发 现 一 个 匹配 行 时 ， 是 否 应 该 将 相应 的 文件 名 打印 出 来 ? 


练习 7*8 编写 一 个 程序 ， 以 打印 一 个 文件 集合 ， 每 个 文件 从 新 的 一 页 开 
始 打印 ， 并 且 打印 每 个 文件 相应 的 标题 和 页 数 。 


7.8 其 它 函 数 

标准 库 提 供 了 很 多 功能 各 异 的 函数 。 本 节 将 对 其 中 特别 有 用 的 函数 做 一 
个 简要 的 概述 。 更 详细 的 信息 以 及 其 它 许多 没有 介绍 的 函数 请 参见 附 
X Bo 

7.8.1. FITE PENE KA 


前 面 已 经 提 到 过 字符 串 函 数 strlen, strcpy. strcat 和 strcmp， 它 们 都 在 
头 文 件 


<string.h> 中 定义 。 在 下 面 的 各 个 函数 中 ，s 与 t 为 char* 类 型 ，c 与 n 为 


int 类 型 。 
ween 将 t 指 向 的 字符 串 连 接 到 s 指向 的 字符 串 的 末尾 


mecc 将 t 指 向 的 字符 串 中 前 n 个 字符 连接 到 s 指向 的 字符 串 的 末 
尾 


woo) 根据 s 指向 的 字符 串 小 于 (s<D、 等 于 (==0 或 大 于 (s>bt 
指向 的 字符 串 的 不 同情 况 ， 分 别 返 回 负 整数 、0 或 正 整数 
moo E] gtremp 相同 ， 但 只 在 前 n 个 字符 中 比较 

wove 将 t 指 向 的 字符 串 复 制 到 s 指向 的 位 置 

mooo ”将 t 指 向 的 字符 串 中 前 n 个 字符 复制 到 s 指向 的 位 置 
uoo RE s 指向 的 字符 串 的 长 度 

















“eo 在 s 指 向 的 字符 串 中 查找 c， 若 找到 ， 则 返回 指向 它 第 一 次 出 
现 的 位 


置 的 指针 ， 人 否则 返回 NULL 


waco ”在 s 指向 的 字符 串 中 查找 c， 若 找到 ， 则 返回 指 让 
出 现 的 


位 置 的 指针 ， 人 否则 返回 NULL 

702, 字符 类 别 测试 和 转换 函数 

头 文 件 <ctypeh> 中 定义 了 些 用 于 字符 测试 和 转换 的 函数 。 在 下 面 各 个 
函数 中 ，c 是 一 个 可 表示 为 unsigned char 类 型 或 EOF 的 int 对 象 。 该 函 
数 的 返回 值 类 型 为 int。 

mowo 大 c 是 字母 ， 则 返回 一 个 非 0 值 ， 否 则 返回 0wr“ 8 Ace 
大 写字 母 ， 则 返回 一 个 非 0 值 ， 否 则 返回 0**“% A ce) SFE, 
则 返回 一 个 非 0 值 ， 否 则 返回 0w*® Fc 是 数字 ， 则 返回 一 个 非 0 
值 ， 人 否则 返回 0 


isal n um( € ) a isalpha(c) 或 isdigit(c), 则 返回 一 个 非 0 值 ， 否则 返回 0 


ov 
at 
c] 
ail 
a 
Ss 











mao ”车 c 是 空格 、 横 向 制 表 符 、 换 行 符 、 回 车 符 ， 换 页 符 或 纵向 制 
表 符 ， 

则 返回 一 个 非 0 值 

wo BRc 的 大 写 形式 


tolo w er( c ) 返回 C 的 小 写 形式 


7.8.3. ungetc 函数 


标准 库 提 供 了 一 个 称 为 ungetc 的 函数 ， 它 与 第 4 章 中 编写 的 函数 
ungetch 相 比 功能 更 受 限 制 。 





int ungetc(int c, FILE *fp) 

该 函数 将 字符 c 写 回 到 文件 印 中 。 如 果 执 行 成 功 ， 则 返回 c， 否 则 返回 
EOF。 每 个 文件 只 能 接收 一 个 写 回 字符 。ungetc 函数 可 以 和 任何 一 个 输 
入 函数 一 起 使 用 ， 比 如 scanf、getc 或 getchar. 

7.8.4. 命令 执行 函数 


函数 system(char* s) 执 行 包 含 在 字符 申 s 中 的 命令 ， 然 后 继续 执行 当前 
程序 。s 的 内 容 在 很 大 程度 上 与 所 用 的 操作 系统 有 关 。 下 面 来 看 一 个 
UNIX 操作 系统 环境 的 小 例子 。 语 句 





system("date"); 

将 执行 程序 date， 它 在 标准 输出 上 打印 当天 的 日 期 和 时 间 。system 函数 
返回 一 个 整 型 的 状 态 值 ， 其 值 来 自 于 执行 的 命令 ， 并 同 具 体系 统 有 
Ko Æ UNIX 系统 中 ， 返 回 的 状态 是 exit 的 返回 值 。 

7.8.5. 存储 管理 函数 

函数 malloc 和 calloc 用 于 动态 地 分 配 存 储 块 。 函 数 malloc 的 声明 如 下 : 


void *malloc(size_t n) 


当 分 配 成 功 时 ， 它 返回 一 个 指针 ， 设 指针 指 网 mn 他 市 长 度 的 未 初始 化 的 
存储 空间 ， 否 则 返回 


NULL. K% calloc 的 声明 为 











void *calloc(size_t n, size_t size) 


当 分 配 成 功 时 ， 它 返回 一 个 指针 ， 该 指针 指 癌 的 空 闪 空间 足以 容纳 由 n 
个 指定 长 度 的 对 象 组 成 的 数组 ， 否 则 返回 NULL。 该 存储 空间 被 初始 化 


为 0。 


根据 请 求 的 对 象 类 型 ，malloc 或 calloc 函数 返回 的 指针 满足 正确 的 对 齐 
要 求 。 下 面 的 例子 进行 了 类 型 转换 : 





int *ip; 

ip = (int *) calloc(n, sizeof(int)); 

free(p) 函 数 释 放 p 指 回 的 存储 空间 ， 其 中 ，p 是 此 前 通过 调用 malloc 或 

calloc K 数 得 到 的 指针 。 存 储 空间 的 释放 顺序 没有 什么 限制 ， 但 是 ， 如 
果 释 放 一 个 不 是 通过 调用 malloc 或 calloc 函数 得 到 的 指针 所 指向 的 存储 
空间 ， 将 是 一 个 很 严重 的 错误 。 


使 用 已 经 释放 的 存储 空间 同样 是 错误 的 。 下 面 所 示 的 代码 是 一 个 很 典型 
的 错误 代码 段 ， 它 通过 一 个 循环 释放 列表 中 的 页 目 : 





for (p = head; p != NULL; p = p*>next) /* WRONG */ free(p); 


ee ele epee ce giray cee oe 
下 所 示 : 





for (p = head; p != NULL; p = q) { q = p*>next; 
free(p); 
} 


8.7 市 给 出 了 一 个 类 似 于 malloc 函数 的 存储 分 配 程序 的 实现 。 该 存储 分 
配 程序 分 配 的 存 储 块 可 以 以 任意 顺 友 释放 。 


7.8.6. 数学 函数 

头 文件 <math.h> 中 声明 了 20 多 个 数学 函数 。 下 面 介 绍 一 些 常 用 的 数学 
函数 ， 每 个 函数 带 有 一 个 或 两 个 double 类 型 的 参数 ， 并 返回 一 个 
double 类 型 的 值 。 

mo Xx 的 正弦 函数 ， 其 中 x 用 弧度 表示 


mx AAR SARA, HP x FIRE eas re YX KREY K Z, 
HP, xA y 用 弧度 表示 ~”“*” ”指数 函数 e 


“x XxX 的 自然 对 数 (以 e 为 底 )， 其 中 ，x>0 

woo x 的 常用 对 数 (以 10 为 底 )， 其 中 ，x>0 

mo) 计算 x* 的 值 

的 平方 根 ( 072.0) 

so X 的 绝对 值 

7.8.7. 随机 数 发 生 器 函数 

函数 rand0 生 成 介 于 0 和 RAND_MAX 之 间 的 伪 随 机 整数 序列 。 其 中 


RAND_MAX 是 在 头 文件 <stdlib.h> 中 定义 的 符号 常量 。 下 面 是 一 种 生 
成 大 于 等 于 0 但 小 于 1 的 随机 浮 点 数 的 方法 : 


#define frand() ((double) rand() / (RAND MAX+1.0)) 


(如 用 所 用 的 函数 库 中 已 经 提供 了 一 个 生成 浮 点 随机 数 的 函数 ， 那 么 它 
可 能 比 上 面 这 个 函数 具有 更 好 的 统计 学 特性 。) 


函数 srand(unsigned) 设 置 rand 函数 的 种 子 数 。 我 们 在 2.7 节 中 给 出 了 遵 
循 标准 的 


rand 和 srand 函数 的 可 移植 的 实现 。 


ae 7°9 类 似 于 isupper IXE HY eK SCAT LAE Ay SUSE LAI BM 8 
空间 或 时 间 的 目的 。 考 虑 市 省 空间 或 时 间 的 实现 方式 。 

















第 8 音 UNIX 系统 接口 


UNIX 操作 系统 通过 一 系列 的 系统 调用 提供 服务 ， 这 些 系统 调用 实际 上 
是 操作 系统 内 的 函数 ， 它 们 可 以 被 用 户 程序 调用 。 本 章 将 介绍 如 何在 C 
语言 程序 中 使 用 一 些 重 要 的 系统 调用 。 如 果 读 者 使 用 的 是 UNIX， 本 章 
将 会 对 你 有 直接 的 帮助 ， 这 是 因为 ， 我 们 经 常 需 要 借助 于 系统 调用 以 
获得 最 高 的 效率 ， 或 者 访问 标准 库 中 没有 的 某 些 功能 。 但 是 ， 即 使 读者 
是 在 其 它 操作 系统 上 使 用 C 语言 ， 本 章 的 例子 也 将 会 帮助 你 对 C 语言 
程序 设计 有 更 深入 的 了 解 。 不 同系 统 中 的 代码 具有 相似 性 ， 只 是 一 些 
细节 上 有 区 别 而 已 。 因 为 ANSIC 标准 函数 库 是 以 UNIX 系统 为 基础 建 
立 起 来 的 ， 所 以 ， 学 习 本 章 中 的 程序 还 将 有 助 于 更 好 地 理解 标准 库 。 


本 章 的 内 容 包括 3 个 主要 部 分 ， 输 入 /输出 、 文 件 系统 和 存储 分 配 。 其 
由， 前 两 部 分 的 内 容 要 求 读者 对 UNIX 系统 的 外 部 特性 有 一 定 的 了 
Ro 


第 7 章 介绍 的 输入 /输出 接口 对 任何 操作 系统 都 是 一 样 的 。 在 任何 特定 
的 系统 中 ， 标 准 库 函 数 的 实现 必须 通过 宿主 系统 提供 的 功能 来 实现 。 
接 下 来 的 几 节 将 介绍 UNIX 系统 中 用 于 输入 和 输出 的 系统 调用 ， 并 介 
绍 如 何 通 过 它们 实现 标准 库 。 


8.1 文件 描述 符 


在 UNIX 操作 系统 中 ， 所 有 的 外 于 设备 (包括 键盘 和 显示 器 ) 都 被 看 作 是 
文件 系统 中 的 文件， 因此， 所 有 的 输入 /和 输出 都 要 通过 读 文 件 或 写 文件 
完成 。 也 惑 是 说 ， 通 过 一 个 单一 的 接口 就 可 以 处 理 外 于 设备 和 程序 之 
间 的 所 有 通信 。 


通常 情况 下 ， 在 读 或 写 文件 之 前 ， 必 须 先 将 这 个 意图 通知 系统 ， 该 过 程 
称 为 打开 文件 。 如 果 是 写 一 个 文件 ， 则 可 能 需要 先 创建 该 文件 ， 也 可 
能 需要 丢 莽 该 文件 中 原先 已 存在 的 内 容 。 系统 检查 你 的 权力 (该 文件 是 
否 存 在 ?是 否 有 访问 它 的 权限 ?)， 如 果 一 切 正常 ， 操 作 采 统 将 向 程序 返 
回 一 个 小 的 非 负 整数 ， 该 整数 称 为 文件 描述 符 。 任 何 时候 对 文件 的 输 

入 /输出 都 是 通过 文件 描述 符 标 识 文 件 ， 而 不 是 通过 文件 名 标识 文件 。 

(文件 描述 符 类 似 于 标准 库 中 的 文件 指针 或 MS*DOS 中 的 文件 句柄 。) 
系统 负责 维护 已 打开 文件 的 所 有 信息 ， 用 户 程 序 只 能 通过 文 件 描述 符 


























引用 文件 ， 


因为 大 多 数 的 输入 /输出 是 通过 键盘 和 显示 絮 来 实现 的 ， 为 了 方便 起 
见 ，UNIX 对 此 做 了 特别 的 安排 。 当 命令 解释 程序 ( 即 “ shell") 运 行 一 个 
程序 的 时 候 ， 它 将 打开 3 个 文件 ， 对 应 的 文件 描述 符 分 别 为 0，1，2， 
依次 表示 标准 输入 ， 标 准 输出 和 标准 错误 。 如 果 程 序 从 文件 0 


中 读 ， 对 1 和 2 进行 写 ， 束 可 以 进行 输 / 输 出 而 不 必 关 心 打 开 文 件 的 问 


题 。 
程序 的 使 用 者 可 通过 < 和 > 重 定 回程 序 的 TO: 
prog < 输入 文件 名 > 输出 文件 名 


这 种 情况 下 ，shell 把 文件 描述 符 0 和 1 的 默认 赋值 改变 为 指定 的 文件 。 
通常 ， 文 件 描述 符 2 仍 与 显示 器 相关 联 ， 这 样 ， 出 错 信 息 会 输出 到 显示 
器 上 。 与 管道 相关 的 输入 /输出 也 有 类 似 的 特性 。 在 任何 情况 下 ， 文 件 
赋值 的 改变 都 不 是 由 程序 完成 的 ， 而 是 由 shell 完成 的 。 只 要 程序 使 用 
E E E 
里 来 ， 并 输 











到 哪里 去 。 
8.2 低级 IO 


输入 与 输出 是 通过 read 和 write 系统 调用 实现 的 。 在 C 语言 程序 中 ， 可 
以 通过 函数 read 和 write 访问 这 两 个 系统 调用 。 这 两 个 函数 中 ， 第 一 个 
参数 是 文件 描述 符 ， 第 二 个 参数 是 程 序 中 存放 读 或 写 的 数据 的 字符 数 
组 ， 第 三 个 参数 是 要 传输 的 字 节 数 。 


read 和 write 





int n_read = read(int fd, char *buf, int n); 
int n_written = write(int fd, char *buf, int n); 


每 个 调用 返回 实际 传输 的 字 节 数 。 在 读 文 件 时 ， 函 数 的 返回 值 可 能 会 小 
于 请 求 的 字 节 数 。 如 果 返 回 值 为 0， 则 表示 已 到 达 文 件 的 结尾 ;如 果 返 
回 值 为 1， 则 表示 发 生 了 某 种 错误 。 在 写 文 件 时 ， 返 回 值 是 实际 写 入 的 
字 节 数 。 如 果 返 回 值 与 请 求 写 入 的 字 节 数 不 相 等 ， 则 说 明 发 生 了 错 


Ro 


在 一 次 调用 中 ， 读 出 或 写 入 的 数据 的 字 节 数 可 以 为 任意 大 小 。 最 常用 的 
值 为 1， 即 每 次 读 出 或 写 入 1 个 字符 (无 缓冲 )， 或 是 类 似 于 102404096 
这 样 的 与 外 围 设备 的 物理 块 大 小 相应 的 值 。 用 更 大 的 值 调用 该 函数 可 
以 获得 更 高 的 效率 ， 因 为 系统 调用 的 次 数 减 少 了 。 


结合 以 上 的 讨论 ， 我 们 可 以 编写 一 个 简单 的 程序 ， 将 输入 复制 到 输出 ， 
这 与 第 1 章 中 的 复制 程序 在 功能 上 相同 。 程 序 可 以 将 任意 输入 复制 到 
任意 输出 ， 因 为 输入 /输出 可 以 重 定 问 到 任何 文件 或 设备 。 











#include "syscalls.h" 

main() /* copy input to output */ 
{ 

char buf[BUFSIZ]; int n; 


while ((n = read(0, buf, BUFSIZ)) > 0) write(1, buf, n); 


return 0; 
} 


我 们 已 经 将 系统 调用 的 函数 诛 型 集中 放 在 一 个 头 文件 syscalls.h 中 ， 
本 章 中 的 程序 都 将 包含 该 头 文件 。 不 过 ， 该 文件 的 名 字 不 是 标准 


参数 BUFSIZ 也 已 经 在 syscalls.h 头 文 件 中 定义 。 对 于 所 使 用 的 操作 系 
统 来 说 ， 该 值 是 一 个 较 合 适 的 数值 。 如 果 文 件 大 小 不 是 BUFSIZ 的 倍 
数 ， 则 对 read 的 某 次 调用 会 返回 一 个 较 小 的 字 节 数 ，write 再 按 这 个 字 
节 数 写 ， 此 后 再 调用 read 将 返回 0。 


为 了 更 好 地 竺 握 有 关 和 概念 下 面 来 说 明 如 何 用 read 和 write 构造 类 似 于 
getchar、 putchar 等 的 高 级 函数 。 例如 ， 以 下 是 getchar 函数 的 一 个 版 
本 ， 它 通过 每 次 从 标准 输入 读 入 一 个 字符 来 实现 无 缓冲 输入 。 





#include "syscalls.h" 
/* getchar: unbuffered single character input */ int getchar(void) 


{ 


char c; 

return (read(0, &c, 1) == 1) ? (unsigned char) c : EOF; 

} 

其 中 ，c 必须 是 一 个 char 类 型 的 变量 ， 因 为 read 函数 需要 一 个 字符 指针 
类 型 的 参数 (&c)。 在 返回 语句 中 将 c 转换 为 unsigned char 类 型 可 以 消除 
符号 扩展 问题 。 

getchar 的 第 二 个 版 本 一 次 读 入 一 组 字符 ， 但 每 次 只 输出 一 个 字符 。 
#include "syscalls.h" 

/* getchar: simple buffered version */ int getchar(void) 

{ 


static char buf[BUFSIZ]; static char *bufp = buf; static int n = 0; 


if (n == 0) { /* buffer is empty */ n = read(0, buf, sizeof buf); bufp = 
buf; 


} 
return (°°n >= 0) ? (unsigned char) *bufp++ : EOF; 
} 


如 果 要 在 包含 头 文 件 <stdio.h> 的 情况 下 编译 这 些 版 本 的 getchar 函数 ， 
就 有 必要 用 


#undef 预 处 理 指 令 取消 名 字 getchar 的 宏 定 义 ， 因 为 在 头 文件 中 ， 
getchar 是 以 宏 方 式 


8.3 open. creat. close 和 unlink 


除了 默认 的 标准 输入 、 标 准 输出 和 标准 错误 文件 外 ， 其 它 文件 都 必须 在 
读 或 写 之 前 显 式 地 打开 。 系 统 调 用 open 和 creat 用 于 实现 该 功能 。 


open 与 第 7 章 讨 论 的 fopen 相似 ， 不 同 的 是 ， 前 者 返回 一 个 文件 描述 
符 ， 它 仅仅 只 是 一 个 int 类 型 的 数值 。 而 后 者 返回 一 个 文件 指针 。 如 果 
发 生 错误 ，open 将 返回 "1。 





#include <fcntl.h> 
int fd; 
int open(char *name, int flags, int perms); fd = open(name, flags, perms); 


与 fopen 一 样 ， 参 数 name 是 一 个 包含 文件 名 的 字符 串 。 第 二 个 参数 
flags 是 一 个 int 类 


型 的 值 ， 它 说 明 以 何 种 方式 打开 文件 ， 主 要 的 几 个 值 如 下 所 示 : 


O_RDONLY 以 只 读 方 式 打 开 文 件 O_WRONLY 以 只 写 方 式 打 开 文 件 
O_RDWR 以 读 写 方式 打开 文件 





在 System V UNIX 系统 中 ， 这 些 常量 在 头 文件 <fcntlh> 中 定义 ， 而 在 
Berkeley(BSD) 版 本 中 则 在 <sys/file.h> 中 定义 。 


可 以 使 用 下 列 语句 打开 一 个 文件 以 执行 读 操作 : 
fd = open(name, O_RDONLY,0); 
在 本 章 的 讨论 中 ，open 的 参数 perms 的 值 始终 为 0。 


如 果 用 open 打开 一 个 不 存在 的 文件 ， 则 将 导致 错误 。 可 以 使 用 creat 系 
统 调用 创建 新 文件 或 覆盖 已 有 的 旧 文 件 ， 如 下 所 示 : 








int creat(char *name, int perms); fd = creat(name, perms); 


如 果 creat 成 功 地 创建 了 文件 ， 它 将 返回 一 个 文件 描述 符 ， 否 则 返回 
1。 如 果 此 文件 已 存在 ， creat 将 把 该 文件 的 长 度 截 时 为 0， 从 而 丢弃 原 
先 已 有 的 内 容 。 使 用 creat 创建 一 个 已 存在 的 文件 不 会 导致 错误 。 


如 果 要 创建 的 文件 不 存在 ， 则 creat 用 参数 perms 指定 的 权限 创建 文 
件 。 在 UNIX 文 件 系统 中 ， 每 个 文件 对 应 一 个 9 比特 的 权限 信息 ， 它 
们 分 别 控制 文件 的 所 有 者 、 所 有 者 组 和 


其 他 成 员 对 文件 的 读 、 写 和 执行 访问 。 因 此 ， 通 过 一 个 3 位 的 八进制 数 
就 可 方便 地 说 明 不 同 的 权限 ， 例 如 ，0755 说 明文 件 的 所 有 者 可 以 对 它 
rae 写 和 执行 操作 ， 而 所 有 者 组 和 其 他 成 员 只 能 进行 读 和 执行 操 
下 面 通过 一 个 简化 的 UNIX 程序 cp 说 明 creat 的 用 法 。 该 程序 将 一 个 文 
件 复制 到 男 一 个 文件 。 我 们 编写 的 这 个 版 本 仅仅 只 能 复制 一 个 文件 ， 
不 允许 用 目录 作为 第 二 个 参数 ， 并 且 ， 目标 文件 的 权限 不 是 通过 复制 
获得 的 ， 而 是 重新 定义 的 。 


#include <stdio.h> 








#include <fcntl.h> 
#include "syscalls.h" 


#define PERMS 0666 /* RW for owner, group, others */ 
void error(char *, a | 


/* cp: copy f1 to f2 */ main(int argc, char *argv[]) 
{ 

int f1, f2, n; char buf[ BUFSIZ]; 

if (argc != 3) 

error(""Usage: cp from to"); 


if ((f1 = open(argv[1], O_RDONLY, 0)) == ¢1) error("cp: can't open %s", 
argv[1]); 


if ((f2 = creat(argv[2], PERMS)) ==。1) error("cp: can't create %s, mode 
%030", 


argv[2], PERMS); 

while ( = read(f1, buf, BUFSIZ)) > 0) if (write(f2, buf, n) != n) 

error("cp: write error on file %s", argv[2]); return 0; 

} 

该 程序 创建 的 输出 文件 具有 固定 的 权限 0666。 利 用 8.6 节 中 将 要 讨论 的 
ae 可 以 获得 一 个 已 存在 文件 的 模式 ， 并 将 此 模式 赋值 给 它 


VER, pea error 类 似 于 函数 printf， 在 调用 时 可 带 变 长 参数 表 。 下 面 通 
过 error P&I 








数 的 实现 说 明 如 何 使 用 printf 函数 家 族 的 另 一 个 成 员 vprintf。 标 准 库 函 
数 vprintf 数 与 printf 函数 类 似 ， 所 不 同 的 是 ， 它 用 一 个 参数 取代 了 变 长 
参数 表 ， 且 此 参数 通过 调用 va_start 宏 进行 初始 化 。 同 样 ，vfprintf 和 
vsprintf 函数 分 别 与 fprintf 和 sprintf 函数 类 似 。 


#include <stdio.h> 

#include <stdarg.h> 

/* error: print an error message and die */ void error(char *fmt, ...) 
{ 

va_list args; 


va_start(args, fmt); fprintf(stderr, "error: "); vprintf(stderr, fmt, args); 
fprintf(stderr, "\n"); va_end(args); 


exit(1); 
} 


一 个 程序 同时 打开 的 文件 数 是 有 限制 的 (通常 为 20)。 相 应 地 ， 如 果 一 个 
程序 需要 同时 处 理 许多 文件 ， 那 么 它 必须 重用 文件 接 述 人 符 。 函 数 
close(int fd) 用 来 断 开 文件 描述 符 和 已 打开 文件 之 间 的 连接 ， 并 释放 此 文 
件 描述 符 ， 以 供 其 它 文 件 使 用 。close 函数 的 fclose 函数 相对 
应 ， 但 它 不 需要 清洗 (flush) 绥 冲 区 。 如 果 程 序 通 过 exit 函数 退出 或 从 E 
程序 中 返回 ， 所 有 打开 的 文件 将 被 关闭 。 


ae 数 oe *name) 将 文件 name 从 文件 系统 中 删除 ， 它 对 应 于 标准 


remove. 


练习 8.1 用 read、write、open 和 close 系统 调 用 代 蔡 标准 库 中 功 
重 写 第 7 章 的 cat 程序 ， 并 通过 实验 比较 两 个 版 本 的 相 
对 执行 速 











8.4 随机 访问 Iseek 


输入 /输出 通常 是 顺序 进行 的 :每 次 调用 read 和 write 进行 读 写 的 位 置 紧 
跟 在 前 一 次 操作 的 位 置 之 后 。 但 是 ， 有 时 候 需 要 以 任意 顺序 访问 文 
件 ， 系 统 调用 lseek 可 以 在 文件 中 任 意 移动 位 置 而 不 实际 读 写 任 何 数据 : 

















long lseek(int fd, long offset, int origin); 

将 文件 描述 符 为 fd 的 文件 的 当前 位 置 设置 为 offset， 其 中 ，offset 是 相 
对 于 orgin 指定 的 位 置 而 言 的 。 随 后 进行 的 读 写 操作 将 从 此 位 置 开 始 ， 
origin 的 值 可 以 为 0、1 或 2， 分 别 用 于 指定 offset 从 文件 开始 、 从 当前 
位 置 或 从 文件 结束 处 开始 算 起 。 例 如 ， 为 了 回 一 个 文 件 的 尾部 添加 内 
容 (在 UNIX shell 程序 中 使 用 重 定 疝 符 >> 或 在 系统 调用 fopen 中 使 用 参 
数 “ ”a")， 则 在 写 操作 之 前 必须 使 用 下 列 系统 调用 找到 文件 的 末尾 : 
Iseek(fd, OL, 2); 

Fr IE OPE TT ea Ah (BN SSE), MU AY DAE AR 7d ded A: 


Iseek(fd, OL, 0); 





请 注意 ， 参 数 0L 也 可 写 为 (long)0， 或 仅仅 写 为 0， 但 是 系统 调用 lseek 
的 声明 必须 保持 一 致 。 


使 用 lseek 系统 调用 时 ， 可 以 将 文件 视 为 一 个 大 数组 ， 其 代价 是 访问 速 
度 会 慢 一 些 。 例 如 ， 下 面 的 函数 将 从 文件 的 任意 位 置 读 入 任意 数目 的 
FH, 它 返 回 读 入 的 字 节 数 ， ARET IR, 则 返回 "1。 





#include "syscalls.h" 


/*get: read n bytes from position pos */ int get(int fd, long pos, char 
*buf, int n) 


{ 

if (Iseek(fd, pos, 0) >= 0) /* get to pos */ return read(fd, buf, n); 

else 

return °1; 

} 

lseek 系统 调用 返回 一 个 long ALA, URI AN CPE, FR 
生 错 误 ， 则 返回 .1。 标准 库 函 数 fseek 与 系统 调用 lseek 类 似 ， 所 不 同 
a 前 者 的 第 一 个 参数 是 FILE * 类 型 ， 且 在 发 生 错 误 时 返回 一 个 非 0 
值 。 

8.5 实例 fopen 和 getc 函数 的 实现 


F 面 以 标准 库 函 数 fopen 和 gete 的 一 种 实现 方法 为 例 来 说 明 如 何 将 这 些 
系统 调用 结合 起 来 使 用 。 


我 们 回忆 一 下 ， 标 准 库 中 的 文件 不 是 通过 文件 描述 从 描述 的 ， 而 是 使 用 
文件 指针 描述 的 。 文件 指针 是 一 个 指向 包含 文件 备 种 信息 的 结构 的 指 
针 ， 该 结构 包含 下 列 内 容 : 一 个 指向 缓冲 区 的 指针 ， 通 过 它 可 以 一 次 读 
入 文件 的 一 大 块 内 容 ;一 个 记录 绥 冲 区 中 剩余 的 字符 数 的 计数 as At 
癌 绥 种 区 中 下 一 个 字符 的 指针 ;文件 描述 符 ; 描 述 读 / 写 模式 的 标志 ; 描 述 错 











误 状态 的 标志 等 。 


描述 文件 的 数据 结构 包含 在 头 文件 <stdio.h> 中 ， 任 何 需要 使 用 标准 输入 / 
输出 库 中 函 数 的 程序 都 必须 在 源 文 件 中 包含 这 个 头 文 件 (通过 项 nclude 

指令 包含 头 文件 )。 此 文件 也 被 库 中 的 其 它 函 数 包 含 。 在 下 面 这 段 典 型 
的 <stdioh> 代 码 段 中 ， 只 供 标准 库 中 其 它 函数 所 使 用 的 名 字 以 下 划 线 开 
0 E 
该 约定 。 











#define NULL 0 

#define EOF (°1) 

#define BUFSIZ 1024 

#define OPEN_MAX 20 /* max #files open at once */ 


typedef struct _iobuf { 


int cnt; /* characters left */ 

char *ptr; /* next character position */ char *base; /* location 
of buffer */ 

int flag; /* mode of file access */ int fd; [7 


file descriptor */ 
} FILE; 


extern FILE _iob[OPEN_MAX]; 


#define stdin (&_iob[0]) 
#define stdout (&_iob[1]) 
#define stderr (&_iob[2]) 


enum _flags { 


_READ = 01, /* file open for reading */ 
_WRITE = 02, /* file open for writing */ 
_UNBUF = 04, /* file is unbuffered */ 

_EOF = 010, /* EOF has occurred on this file */ 
_ERR = 020 /* error occurred on this file */ 

} 


int _fillbuf(FILE *); 


int _flushbuf(int, FILE *); 


#define feof(p) ((p)*>flag & _EOF) != 0) 
#define ferror(p) ((p)*>flag & _ERR) != 0) 
#define fileno(p) ((p)*>fd) 

#define getc(p) (**(p)*>cnt >= 0 \ 


? (unsigned char) *(p)*>ptr++ : _fillbuf(p)) 
#define putc(x,p) (**(p)*>cnt >= 0 \ 
? *(p)e>ptrt++ = (x) : _flushbuf((x),p)) 


#define getchar() getc(stdin) 


#define putcher(x) putc((x), stdout) 


宏 gete 一 般 先 将 计数 器 减 1， 将 指针 移 到 下 一 个 位 置 ， 然 后 返回 字符 。 
(前 面 讲 过 ， 一 个 长 的 #define 语句 可 用 反 和 斜 杠 分 成 几 行 。) 但 是 ， 如 果 计 
数值 变 为 负 值 ，getc 就 调用 函数 


_fillbuf 填充 绥 冲 区 ， 重 新 初始 化 结构 的 内 容 ， 并 返回 一 个 字符 。 返 回 
的 字符 为 unsigned 


类 型 。 以 确保 所 有 的 字符 为 正 值 。 


尽管 在 这 里 我 们 并 不 想 讨论 一 些 细节 ， 但 程序 中 还 是 给 出 了 pute 函数 
的 定义 ， 以 表明 它 的 操作 与 gete 函数 非常 类 似 ， 当 缓冲 区 满 时 ， 它 将 
调用 函数 _flushbuf。 此 外 ， 我 们 还 在 其 中 包含 了 访问 错误 输出 、 文 件 结 
束 状态 和 文件 描述 符 的 宏 。 


下 面 我 们 来 着 手 编写 函数 fopen. fopen 函数 的 主要 功能 是 打开 文件 ， 定 
位 到 合适 的 位 置 ， 设 置 标志 位 以 指示 相应 的 状态 。 它 不 分 配 任何 缓冲 
区 空间 ， 绥 冲 区 的 分 配 是 在 第 一 次 读 文件 时 由 函数 fillbuf 完成 的 。 











#include <fcntl.h> 

#include "syscalls.h" 

#define PERMS 0666 /* RW for owner, group, others */ 
FILE *fopen(char *name, char *mode) 

{ 

int fd; FILE *fp; 

if (*mode != 'r && *mode != 'w' && *mode != 'a') return NULL; 


for (fp = _iob; fp < _iob + OPEN_MAX; fp++) if ((fpe>flag & (_ READ | 
_WRITE)) == 0) 


break; /* found free slot */ 


if (fp >= _iob + OPEN_MAX) /* no free slots */ 


return NULL; 

if (*mode == 'w') 

fd = creat(name, PERMS); else if (*mode == 'a’) { 

if (fd = open(name, O_WRONLY, 0)) == #1) fd = creat(name, PERMS); 
Iseek(fd, OL, 2); 

} else 

fd = open(name, O_RDONLY, 0); 

if (fd == 1) /* couldn't access name */ return NULL; 

fp*>fd = fd; fp°>cnt = 0; fp*>base = NULL; 

fpe>flag = (*mode == 'r') ?_ READ : WRITE; return fp; 

} 

该 版 本 的 fopen 函数 没有 涉及 标准 C 的 所 有 访问 模式 ， 但 是 ， 加 入 这 些 
模式 并 不 需要 增加 多 少 代 码 。 特 别 是 ， 该 版 本 的 fopen 不 能 识别 表示 二 
进 制 访 问 方式 的 b 标志， 这 是 因为 ， 在 UNIX 系统 中 这 种 方式 是 没有 意 
义 的 。 同 时 ， 它 也 不 能 识别 允许 同时 进行 读 和 写 的 + 标志 。 


对 于 某 一 特定 的 文件 ， 第 一 次 调用 getc 函数 时 计数 值 为 0， 这 样 就 必须 
调用 一 次 函数 

_fillbuf。 如 果 _fillbuf 发 现 文件 不 是 以 读 方式 打开 的 ， 它 将 立即 返回 
EOF; 人 否则 ， 它 将 

试图 分 配 一 个 缓冲 区 (如 果 读 操作 是 以 缓冲 方式 进行 的 话 )。 


建立 缓冲 区 后 ，_fillbuf 调用 read 填充 此 缓冲 区 ， 设 置 计 数值 和 指针 ， 
并 返回 缓冲 区 中 的 第 一 个 字符 。 随 后 进行 的 _fillbuf 调用 会 发 现 缓冲 区 
己 经 分 配 。 








#include "syscalls.h" 

/* _fillbuf: allocate and fill input buffer */ int _fillbuf(FILE *fp) 
{ 

int bufsize; 

if ((fpe>flag&(_READ|_EOF_ERR)) != READ) return EOF; 


bufsize = (fpe>flag & _UNBUF) ? 1 : BUFSIZ; if (fp*>base == 
NULL) /* no buffer yet */ 


if ((fpe>base = (char *) malloc(bufsize)) == NULL) return EOF; /* 
can't get buffer */ 


fp*>ptr = fp*>base; 

fp°>cnt = read(fp*>fd, fp*>ptr, bufsize); 让 (*。fp。>cnt< 0) { 
if (fp*>cnt == °1) fp*>flag |= _EOF; 

else 

fp:>flag |= _ERR; fp*>cnt = 0; 

return EOF; 

} 

return (unsigned char) *fp*>ptr++; 

} 


最 后 一 件 事情 便 是 如 何 执行 这 些 函 数 。 我 们 必须 定义 和 初始 化 数组 iob 
中 的 stdin、 








stdout 和 stderr 值 : 

FILE iob[OPEN MAX] = { /* stdin, stdout, stderr */ 
{ 0, (char *) 0, (char *) 0, READ, 0 }, 

{ 0, (char *) 0, (char *) 0, WRITE, 1 }, 

{ 0, (char *) 0, (char *) 0, WRITE, | UNBUF, 2 } 

} 


该 结构 中 flag 部 分 的 初 值 表明 ， 将 对 stdin 执行 读 操 作 、 对 stdout 执行 
写 操作 、 对 stderr 


执行 缓冲 方式 的 写 操作 。 


练习 8.2 用 字段 代 蔡 显 式 的 按 位 操作 ， 重 写 fopen 和 _fillbuf 函数 。 比 较 
相应 代 码 的 长 度 和 执行 速度 。 


练习 8.3 设计 并 编写 函数 flushbuf, fflush 和 fclose. 练习 
8.4 标准 库 函 数 


int fseek(FILE *fp, long offset, int origin) 
类 似 于 函数 lseek， 所 不 同 的 是 ， 该 函数 中 的 fp 是 一 个 文件 指针 而 不 是 


文件 描述 符 ， 且 返回 值 是 一 个 int 类 型 的 状态 而 非 位 置 值 。 编 写 函数 
fseek， 并 确保 该 函数 与 库 中 其 它 函 数 使 用 的 缓冲 能 够 协同 工作 。 


8.6 实例 一 目录 列表 


我 们 常常 还 需要 对 文件 系统 执行 另 一 种 操作 ， 以 获得 文件 的 有 关 信 息 ， 
而 不 是 读 取 文件 的 具体 内 容 。 目 录 列 表 程 序 便 是 其 中 的 一 个 例子 ， 比 
如 UNIX 命令 18， 它 打印 一 个 目录 中 的 文 件 名 以 及 其 它 一 些 可 选 信息 ， 
0 0 
功能。 


由 于 UNIX 中 的 目录 就 是 一 种 文件 ， 因 此 ，ls 只 需要 读 此 文件 就 可 获得 




















所 有 的 文件 名 。 但 是 ， 如 果 需 要 获取 文件 的 其 它 信 息 ， 比 如 长 度 等 ， 

就 需要 使 用 系统 调用 。 在 其 它 一 些 系统 中 ， 甚至 获取 文件 名 也 需要 使 
用 系统 调用 ， 例 如 在 MS*DOS 系统 中 即 如 此 。 无 论 实现 方式 是 否 同 具 
体 的 系统 有 关 ， 我 们 需要 提供 一 种 与 系统 无 关 的 访问 文件 信息 的 途径 。 


以 下 将 通过 程序 fsize 说 明 这 一 点 。fsize 程序 是 ls 命令 的 一 个 特殊 形 
式 ， 它 打印 命令 行 参数 表 中 指定 的 所 有 文件 的 长 度 。 如 果 其 中 一 个 文 
件 是 目录 ， 则 fsize 程序 将 对 此 目录 递 归 调 用 上 自身。 如 果 命 令 行 中 没有 
任何 参数 ， 则 fsize 程序 处 理 当 前 目录 。 


我 们 首先 回顾 UNIX 文件 系统 的 结构 。 在 UNIX 系统 中 ， 目 录 惑 是 文 
件 ， 它 包含 了 一 个 文件 名 列表 和 一 些 指示 文件 位 置 的 信息 。" 位 置 "是 一 
个 指向 其 它 表 ( 即 i 结 点 表 ) 的 索引 。 文件 的 i 结 点 是 存放 除 文件 名 以 外 
BUTE OC Fr E 的 地 方 。 目 录 页 通常 仅 包含 两 个 条 目 :文件 AA i 
编写 。 




















遗憾 的 是 ， 在 不 同 版 本 的 系统 中 ， 目 录 的 格式 和 确切 的 内 容 是 不 一 样 
的 。 因 此 ， 为 了 分 离 出 不 可 移植 的 部 分 ， 我 们 把 任务 分 成 两 部 分 。 外 
层 定义 了 一 个 称 为 Dirent 的 结构 和 3 个 函数 opendir、readdir 和 
closedir， 它 们 提供 与 系统 无 关 的 对 目录 页 中 的 名 字 和 i 结 点 编号 的 访 
问 。 我 们 将 利用 此 接口 编写 fsize 程序 ， 然 后 说 明 如 何在 与 Version 7 和 
n V UNIX 系统 的 目录 结构 相同 的 系统 上 实现 这 些 函 数 。 其 它 情况 
FA kA | o 


结构 Dirent 包含 1 结 点 编号 和 文件 名 。 文 件 名 的 最 大 长 度 由 
NAMZ_MAX 设 定 ，NAME_MAX 的 值 由 系统 决定 。opendir 返回 一 个 
指 问 称 为 DIR 的 结构 的 指针 ， 该 结构 与 结构 FILE 类 似 ， 它 将 被 readdir 
和 closedir 使 用 。 所 有 这 些 信息 存放 在 头 文件 dirent.h 中 。 


#define NAME MAX 14 /* longest filename component; */ 











/* systemedependent */ 


typedef struct { /* portable directory entry */ long ino; 
/* inode number */ 


char name[NAME_ MAX+1]; /* name + '\O' terminator */ 
} Dirent; 
typedef struct { /* minimal DIR: no buffering, etc. */ int fd; 


/* file descriptor for the directory */ 
Dirent d; /* the directory entry */ 
} DIR; 


DIR *opendir(char *dirname); Dirent *readdir(DIR *dfd); void closedir(DIR 
*dfd); 


系统 调用 stat 以 文件 名 作为 参数 ， 返 回 文件 的 i 结 点 中 的 所 有 信息 ;大 出 
音 ， 则 返回 "1。 如 下 所 示 : 


char *name; 
struct stat stbuf; 
int stat(char *, struct stat *); stat(name, &stbuf); 


它 用 文件 name 的 i 结 点 信息 填充 结构 stbhuf。 头 文件 <sys/stat.h> 中 包含 
了 描述 stat 








的 返回 值 的 结构 。 该 结构 的 一 个 典型 形式 如 下 所 示 : 


struct stat /* inode information returned by stat */ 





' inode number */ 


™ number of links 


" time last modified */ 
; Originally created / 








六 结构 中 大 部 分 的 值 已 在 注 释 中 进行 了 解释 。 dev_t 和 ino_t 等 类 型 
ERA 


<sys/types.h> 中 定义 ， 程 序 中 必须 包含 此 文件 。 


st_mode 页 包含 了 描述 文件 的 一 系列 标志 ， 这 些 标志 在 <sys/stat.h> 中 定 
义 。 我 们 只 需要 处 理 文件 类 型 的 有 关 部 分 : 


#define S_IFMT 0160000 /* type of file: */ 
#define S_IFDIR 0040000 /* directory */ 


#define S_TFCHR 0020000 /* character special */ 


#define S_IFBLK 0060000 /* block special */ 

#define S_IFREG 0010000 /* regular */ 

apres 

下 面 我 们 来 着 手 编写 程序 fsize。 如 有 果 由 stat 调用 获得 的 模式 说 明 某 文件 
不 是 一 个 目录 ， 束 很 容易 获得 该 文件 的 长 度 ， 并 直接 和 输出。 但 是 ， 如 
条 文件 是 一 个 目录 ， 则 必须 逐个 处 理 目录 中 的 文件 。 由 于 该 目录 可 能 
包含 子 目 录 ， 因 此 该 过 程 是 递归 的 。 

主 程序 main 处 理 命令 行 参数 ， 并 将 每 个 参数 传递 给 函数 fsize。 


#include <stdio.h> 





#include <string.h> 


#include "syscalls.h" 


#include <fcntl.h> /* flags for read and write */ 
#include <sys/types.h> /* typedefs */ 
#include <sys/stat.h> /* structure returned by stat */ 


#include "dirent.h" void fsize(char *) 

/* print file name */ main(int argc, char **argv) 

{ 

if (argc == 1) /* default: current directory */ fsize("."); 
else 

while (**argc > 0) fsize(*++argv); 


return 0; 


} 


函数 fsize 打印 文件 的 长 度 。 但 是 ， 如 果 此 文件 是 一 个 目录 ， 则 fsize 首 
先 调用 dirwalk 函数 处 理 它 所 包含 的 所 有 文件 。 注 意 如 何 使 用 文件 
<sys/stat.h> 中 的 标志 名 S_IFMT 和 S_IFDIR 来 判定 文件 是 不 是 一 个 目 
录 。 括 号 是 必须 的 ， 因 为 & 运 算 符 的 优先 级 低 于 == 运 算 符 的 优先 级 。 





int stat(char *, struct stat *); 

void dirwalk(char *, void (*fcn)(char *)); 

/* fsize: print the name of file "name" */ void fsize(char *name) 

{ 

struct stat stbuf; 

if (stat(name, &stbuf) == «1) { 

fprintf(stderr, "fsize: can't access %s\n", name); return; 

} 

if ((stbuf.st_mode & S_IFMT) == S_IFDIR) dirwalk(name, fsize); 
printf("%8ld %s\n", stbuf.st_size, name); 

} 

函数 dirwalk 是 一 个 通用 的 函数 ， 它 对 目录 中 的 每 个 文件 都 调用 函数 fen 
一 次 。 它 首先 打开 目录 ， 循 环 过 有 历 其 中 的 每 个 文件 ， 并 对 每 个 文件 调 


用 该 函数 ， 然 后 关闭 目录 返回 。 因 为 fsize 函数 对 每 个 目录 都 要 调用 
dirwalk 函数 ， 所 以 这 两 个 函数 是 相互 递归 调用 的 。 

















#define MAX_PATH 1024 


/* dirwalk: apply fcn to all files in dir */ void dirwalk(char *dir, void 
(*fcn)(char *)) 


{ 

char name[MAX_PATH]; Dirent *dp; 

DIR *dfd; 

if ((dfd = opendir(dir)) == NULL) { 

fprintf(stderr, "dirwalk: can't open %s\n", dir); return; 

} 

while ((dp = readdir(dfd)) != NULL) { if (stremp(dp*>name, ".") == 0 
|| strcmp(dp*>name, "..")) 

continue; /* skip self and parent */ 


if (strlen(dir)+strlen(dpe>name)+2 > sizeof(name)) fprintf(stderr, "dirwalk: 
name %s %s too long\n", 


dir, dp->name); 

else { 

sprintf(name, "%s/%s", dir, dpe>name); (*fcn)(name); 
} 

} 

closedir(dfd); 


} 


每 次 调用 readdir 都 将 返回 一 个 指针 ， 它 指 同 下 一 个 文件 的 信息 。 如 果 
目录 中 己 没 有 待 处 理 的 文件 ， 该 函数 将 返回 NULL。 每 个 目录 都 包含 目 
ao 目录 “.." 的 页 目 ， 在 处 理 时 必须 跳 过 它们 ， 否 则 将 会 导致 无 
限 循 环 。 


到 现在 这 一 步 为 止 ， 代 码 与 目录 的 格式 无 天 。 下 一 步 要 做 的 事情 束 是 在 
某 个 具体 的 系统 上 提供 一 个 opendir、readdir 和 closedir 的 最 简单 版 

本 。 以 下 的 函数 适用 于 Version 7 和 System V UNIX 系统 ， 它 们 使 用 了 
头 文件 (sys/dirh> 中 的 目录 信息 ， 如 下 所 示 : 





#ifndef DIRSIZ 

#define DIRSIZ 14 

#endif 

struct direct { /* directory entry */ ino_t d_ino; /* 


inode number */ 

char d_name[DIRSIZ |; /* long name does not have '\0' */ 

}; 

某 些 版 本 的 系统 文 持 更 长 的 文件 名 和 更 复杂 的 目录 结构 。 

类 型 ino_t 是 使 用 typedef 定义 的 类 型 ， 它 用 于 描述 i 结 点 表 的 索引 。 在 
我 们 通常 使 用 的 系统 中 ， 此 类 型 为 unsigned short， 但 是 这 种 信息 不 应 
在 程序 中 使 用 。 因 为 不 同 的 系统 中 该 类 型 可 能 不 同 ， 所 以 使 用 typedef 
定义 要 好 一 些 。 所 有 的 "系统 "类 型 可 以 在 文件 

<sys/types.h) 中 找到 。 


opendir 函数 首先 打开 目录 ， 验 证 此 文件 是 一 个 目录 (调用 系统 调用 
fstat， 它 与 stat 


但 它 以 文件 描述 符 作为 参数 )， 然 后 分 配 一 个 目录 结构 ， 并 你 存 





int fstat(int fd, struct stat *); 


/* opendir: open a directory for readdir calls */ DIR *opendir(char 
*dirname) 


{ 

int fd; 

struct stat stbuf; DIR *dp; 

if ((fd = open(dirname, O_RDONLY, 0)) == «1 

|| fstat(fd, &stbuf) == «1 

|| (stbuf.st_mode & S_IFMT) != S_IFDIR 

|| (dp = (DIR *) malloc(sizeof(DIR))) == NULL) return NULL; 
dp*>fd = fd; return dp; 

} 

closedir 函数 用 于 关闭 目录 文件 并 释放 和 内存 空间 : 


/* closedir: close directory opened by opendir */ void closedir(DIR 
*dp) 


{ 

if (dp) { 

close(dp*>fd); free(dp); 
} 

} 


iia, ek readdir 使 用 read 系统 调用 读 取 每 个 目录 页 。 如 果 某 个 目录 
位 置 当前 没有 使 用 (因为 删除 了 一 个 文件 )， 则 它 的 i 结 点 编写 为 0， 并 








中 过 该 位 置 。 否 则 ， 将 i 结 点 编号 和 目录 名 放 在 一 个 static 类 型 的 结构 
中 ， 并 给 用 户 返 回 一 个 指 同 此 结构 的 指针 。 每 次 调用 readdir KZO 
六 前 一 次 调用 获得 的 信息 。 





#include <sys/dir.h> /* local directory structure */ 

/* readdir: read directory entries in sequence */ Dirent *readdir(DIR 
*dp) 

{ 

struct direct dirbuf; /* local directory structure */ static 
Dirent d; /* return: portable structure */ 


while (read(dp*>fd, (char *) &dirbuf, sizeof(dirbuf)) 
== sizeof(dirbuf)) { 
if (dirbuf.d_ino == 0) /* slot not in use */ continue; 


d.ino = dirbuf.d_ino; 


strncpy(d.name, dirbuf.d_name, DIRSIZ); d.name[DIRSIZ] = '\0'; /* 
ensure termination */ return &d; 

} 

return NULL; 

} 

尽管 fsize 程序 非常 特殊 ， 但 是 它 的确 说 明了 一 些 重 要 的 思想 。 首 先 ， 





许多 程序 并 不 是 "系统 程序 "， 它 们 仅仅 使 用 由 操作 系统 维护 的 信息 。 对 
于 这 样 的 程序 ， 很 重要 的 一 点 是 ， 信 ARRI LE bs ES CE 
中 ， 使 用 它们 的 程序 只 需要 在 文件 中 包含 这 些 头 文件 即 可 ， 而 不 需要 
eae 明 。 其 次 ， 有 可 能 为 与 系统 相关 的 对 象 创 建 一 个 与 系统 无 
关 的 接口 。 标 

















准 库 中 的 函数 就 是 很 好 的 例子 。 


练习 8.5 ”修改 fsize 程序 ， 打 印 i 结 点 页 中 包含 的 其 它 信 息 。 
8.7 实例 一 一 和 存储 分 配 程序 


我 们 在 第 5 章 给 出 了 一 个 功能 有 限 的 面向 校 的 存储 分 配 程 序 。 本 节 将 要 
编写 的 版 本 没有 限制 ， 可 以 以 任意 次 序 调 用 malloc 和 free。malloc 在 
必要 时 调用 操作 系统 以 获取 更 多 的 存储 空间 。 这 些 程序 说 明了 通过 一 
种 与 系统 无 关 的 方式 编写 与 系统 有 关 的 代码 时 应 考虑 的 问题， 同时 也 
展示 了 结构 、 联 合 和 typedef 的 实际 应 用 。 


malloc 并 不 是 从 一 个 在 编译 时 束 确 定 的 固定 大 小 的 数组 中 分 配 存 储 空 
间 ， 而 是 在 需要 时 问 操 作 系统 申 请 空间 。 因 为 程序 中 的 某 些 地 方 可 能 
不 通过 malloc 调用 申请 空间 (也 就 是 说 ， 通过 其 它 方式 申请 空间 )， 所 
以 ，malloc 管理 的 空间 不 一 定 是 连续 的 。 这 样 ， 空 闲 存储 空间 以 空闲 
块 链表 的 方式 组 织 ， 每 个 块 包 含 一 个 长 度 、 一 个 指向 下 一 块 的 指针 以 及 
一 个 指 同 自 喘 存储 空间 的 指针 。 这 些 块 按 照 存储 地 址 的 升序 组 织 ， 最 
后 一 块 (最 高 地 址 ) 指 疝 第 一 块 ( 参 见 图 8.1). 














free het 








| free, owned by malloc 





in usc| in usc, owned by mallec 








cit | not owned by malloc 


图 8.1 


当 有 申请 请 求 时 ，malloc 将 扫描 空闲 块 链表 ， 直 到 找到 一 个 足够 大 的 块 
为 止 。 该 算法 称 为 "首次 适应 "(first ”fit); 与 之 相对 的 算法 是 "最 佳 适应 " 
(best ”fit)， 它 寻找 满足 条 件 的 最 小 块 。 如 果 该 块 恰好 与 请 求 的 大 小 相 
符合 ， 则 将 它 从 链表 中 移 走 并 返回 给 用 户 。 如 果 该 块 太 大 ， 则 将 它 分 
成 两 部 分 :大 小 合适 的 块 返回 给 用 户 ， 剩 下 的 部 分 留 在 空闲 块 链表 中 。 
如 琳 找 不 到 一 个 足够 大 的 块 ， 则 向 操作 系统 申请 一 个 大 块 并 加 入 到 空 





朵 块 链表 中 。 


释放 过 程 也 是 首先 搜索 空 几 块 链表 ， 以 找到 可 以 插入 被 释放 块 的 合适 位 
置 。 如 果 与 被 释 放 块 相 邻 的 任 一 边 是 一 个 空间 块 ， 则 将 这 两 个 块 合成 
一 个 更 大 的 块 ， 这 样 存储 空间 不 会 有 太 多 的 碎片 。 因 为 空 采 块 链表 是 
以 地 址 的 递增 顺序 链接 在 一 起 的 ， 所 以 很 容易 判断 相 邻 的 块 是 否 空 

W o 


我 们 在 第 5 章 中 曾 提出 了 这 样 的 问题 ， 即 确保 由 malloc 函数 返回 的 存 
储 空间 满足 将 要 保存 的 对 象 的 对 齐 要 求 。 虽 然 机 器 类 型 各 异 ， 但 是 ， 
每 个 特定 的 机 器 都 有 一 个 最 受 限 的 类 型 : 如 果 最 受 限 的 类 型 可 以 存储 在 
茶 个 特定 的 地 址 中 ， 则 其 它 所 有 的 类 型 也 可 以 存放 在 此 地 址 中 。 在 某 
些 机 器 中 ， 最 受 限 的 类 型 是 double 类 型 ;而 在 另外 一 些 机 器 中 ， 最 受 限 
的 类 型 是 int 或 long 类 型 。 


空 闪 块 包 含 一 个 指 问 链表 中 下 一 个 块 的 指针 、 一 个 块 大 小 的 记录 和 一 个 
指 回 空闲 空间 本 














身 的 指针 。 位 于 块 开始 处 的 控制 信息 称 为 " 头 部 "。 为 了 简化 块 的 对 齐 ， 
所 有 块 的 大 小 都 必 须 是 头 部 大 小 的 整数 倍 ， 且 头 部 已 正确 地 对 齐 。 这 
是 通过 一 个 联合 实现 的 ， 该 联合 包含 所 需 的 头 部 结构 以 及 一 个 对 齐 要 
求 最 受 限 的 类 型 的 实例 ， 在 下 面 这 段 程序 中 ， 我 们 假定 long 类 型 为 最 
受 限 的 类 型 : 








typedef long Align; /* for alignment to long boundary */ 
union header { /* block header */ struct { 
union header *ptr; /* next block if on free list */ unsigned size; /* 


size of this block */ 

}s; 

Align x; /* force alignment of blocks */ 
} 

typedef union header Header; 


在 该 联合 中 ，Align 字段 永远 不 会 被 使 用 ， 它 仅仅 用 于 强制 每 个 头 部 在 
最 坏 的 情况 下 满足 对 齐 要 求 。 


在 malloc 函数 中 ， 请 求 的 长 度 (以 字符 为 单位 ) 将 被 舍 和 入， 以 保证 它 是 头 
部 大 小 的 整 数 倍 。 实 际 分 配 的 块 将 多 包含 一 个 单元 ， 用 于 头 部 本 喘 。 
实际 分 配 的 块 的 大 小 将 被 记录 在 头 部 的 size 字段 中 。malloc 函数 返回 
的 指引 将 指向 空闲 空间 ， 而 不 是 块 的 头 部 。 用 户 可 对 获 得 的 存储 空间 
进行 任何 操作 ， 但 是 ， 如 果 在 分 配 的 存储 空间 之 外 写 入 数据 ， 则 可 能 会 
破坏 块 链表 。 图 8.2 表示 由 malloc 返回 的 块 。 





-一 一 ”~ points to next free block 


size 


de 


—— address returned to user 


A block returned by malloc 


图 8.2 malloc 返回 的 块 


其 中 的 size 字段 是 必需 的 ， 因为 由 malloc 函数 控制 的 块 不 一 定 是 连续 
的 ， 这 样 束 不 可 能 通过 指针 算术 运算 计算 其 大 小 。 


变量 base 表示 空闲 块 链表 的 头 部 。 第 一 次 调用 malloc 函数 时 ，freep 为 
NULL. 条 统 将 创建 ,个 退化 汐 党 亲 块 链表， 它 只 包含 一 个 大 小 为 0 的 
块 ， 且 该 块 指 同 它 自己 。 任 何 情况 下 ， 当 请 求 空 亲 空间 时 ， 都 将 搜索 
空闲 块 链 表 。 搜 索 从 上 一 次 找到 空闲 块 的 地 方 (freep) 开始 。 ae 
保证 链表 是 均匀 的 。 如 果 找 到 的 块 太 大 ， 则 将 其 尾部 返回 给 用 户 ， 这 

样 ， 初始 块 的 头 部 只 需要 修改 size 字段 即 可 。 在 任何 情况 下 ， 返回 给 
ee 的 指针 都 指向 块 内 的 空 朵 存储 空间 ， 即 比 指向 头 部 的 指针 大 一 个 

有 




















static Header base; /* empty list to get started */ static Header *freep 
= NULL; /* start of free list */ 
/* malloc: generalepurpose storage allocator */ void 


*malloc(unsigned nbytes) 


í 
Header *p, *prevp; 
Header *moreroce(unsigned); unsigned nunits; 


nunits = (nbytes+sizeof(Header)*1)/sizeof(header) + 1; if ((prevp = freep) == 
NULL) { /* no free list yet */ 


base.s.ptr = freeptr = prevptr = &base; base.s.size = 0; 


} 


for (p = prevp*>s.ptr; ; prevp = p, p = p*>s.ptr) { if (pe>s.size >= nunits) 
{ /* big enough */ 


if (p*>s.size == nunits) /* exactly */ prevp*>s.ptr = p*>s.ptr; 
else { /* allocate tail end */ p*>s.size °= nunits; 

p += pe>s.size; pe>s.size = nunits; 

} 

freep = prevp; 


return (void *)(p+1); 


} 

if (p == freep) /* wrapped around free list */ if ((p = 
morecore(nunits)) == NULL) 

return NULL; /* none left */ 

} 


} 


函数 morecore 用 于 辐 操 作 系 统 请 求 存 储 空 间 ， 其 实现 细节 因 系 统 的 不 
同 而 不 同 。 因 为 回 系 统 请 求 存 储 空 间 是 一 个 开销 很 大 的 操作 ， 因 此 ， 
我 们 不 希望 每 次 调用 malloc 函数 时 都 执行 该 操作 ， 基 于 这 个 考虑 ， 
morecore 函数 请 求 至 少 NALLOC 个 单元 。 这 个 较 大 的 块 将 根 据 需 要 分 
成 较 小 的 块 。 在 设置 完 size 字段 之 后 ，morecore 函数 调用 free 函数 把 多 
余 的 存 储 空间 插入 到 空闲 区 域 中 。 


UNIX 系统 调用 sbrk(n) 返 回 一 个 指针 ， 该 指针 指 癌 n 个 字 节 的 存储 空 

间 。 如 果 没 有 空 闲 空间 ， 尽 管 返回 NULL 可 能 更 好 一 些 ， 但 sbrk 调用 
返回 1。 必须 将 *1 强制 转换 为 char * 类 型 ， 以 便 与 返回 值 进行 比较 。 而 
且 ， 强 制 类 型 转换 使 得 该 函数 不 会 受 不 同 机 器 中 指针 表示 的 不 同 的 影 
响 。 但 是 ， 这 里 仍然 假定 ， 由 sbrk 调用 返回 的 指向 不 同 块 的 多 个 指针 
之 间 可 以 进行 有 意义 的 比较 。ANSI 标准 并 没有 保证 这 一 点 ， 它 只 允许 
指向 同一 个 数组 的 指针 间 的 比较 。 因此， 只 有 在 一 般 指针 间 的 比较 操 
作 有 意义 的 机 器 上 ， 该 版 本 的 malloc 函数 才能 够 移植 。 


#define NALLOC 1024 /* minimum #units to request */ 











/* morecore: ask system for more memory */ static Header 
*morecore(unsigned nu) 


{ 

char *cp, *sbrk(int); Header *up; 

if (nu < NALLOC) nu = NALLOC; 

cp = sbrk(nu * sizeof(Header)); 

if (cp == (char *) «1) /* no space at all */ return NULL; 


up = (Header *) cp; 


up*>s.size = nu; free((void *)(up+1)); return freep; 
} 


我 们 最 后 来 看 一 下 free 函数 。 它 从 freep 指向 的 地 址 开始 ， 逐 个 扫描 空 
朵 块 链表 ， 寻 找 可 以 插入 空闲 块 的 地 方 。 该 位 置 可 能 在 两 个 空闲 块 之 
间 ， 也 可 能 在 链表 的 末尾 。 在 任何 一 种 情况 下 ， 如 果 被 释放 的 块 与 男 
一 空闲 块 相 邻 ， 则 将 这 两 个 块 合 并 起 来 。 合 并 两 个 块 的 操作 很 简单 ， 
只 需要 设置 指针 指 癌 正确 的 位 置 ， 并 设置 正确 的 块 大 小 就 可 以 了 。 








/* free: put block ap in free list */ void free(void *ap) 

{ 

Header *bp, *p; 

bp = (Header *)ap ° 1; /* point to block header */ 


for (p = freep; !(bp > p && bp < pe>s.ptr); p = p*>s.ptr) if (p >= pe>s.ptr && 
(bp > p || bp < pe>s.ptr)) 


break; /* freed block at start or end of arena */ 


if (bp + bp*>size == p*>s.ptr) { /* join to upper nbr */ bps>s.size += 
p*>s.ptre>s.size; 


bp。>s.ptr = p*>s.ptre>s. ptr; 
} else 
bpe>s.ptr = p*>s.ptr; 


if (p + p*>size == bp) { /* join to lower nbr */ p*>s.size += 
bpe>s.size; 


p*>s.ptr = bp*>s.ptr; 


} else 


p*>s.ptr = bp; freep = p; 


虽然 存储 分 配 从 本 质 EAE DL AY 但 是 ， 以 上 的 代码 说 明了 如 何 
控制 与 具体 机 器 相关 的 部 分 ， 并 将 这 部 分 程序 控制 到 最 少量 。typedef 
和 union 的 使 用 解决 了 地 址 的 对 齐 (假定 sbrk 返回 的 是 合适 的 指针 ) 问 
题 。 类 型 的 强制 转换 使 得 指针 的 转换 是 显 式 进行 的 ， 这 样 做 甚至 可 以 
处 理 设 计 不 够 好 的 系统 接口 问题 。 虽 然 这 里 所 讲 的 内 容 只 涉及 到 存储 分 
配 ， 但 是 ， 这 种 通用 方法 也 适用 于 其 它 情况 。 


练习 8°6 PREE KZ calloc(n, size) 返 回 一 个 指针 ， 它 指 癌 nn 个 长 度 为 
size 的 对 象 ， 且 所 有 分 配 的 存储 空间 都 被 初始 化 为 0。 通 过 调用 或 修改 
malloc 函数 来 实现 calloc 函数 。 


练习 8*7 malloc 接收 对 存储 空间 的 请 求 时 ， 并 不 检查 请 求 长 度 的 
合理 性 ;而 free 


则 认为 被 释 放 的 块 包含 一 个 有 效 的 长 度 字 段 。 改 进 这 些 函 数 ， 使 它们 具 
有 错 误 检查 的 功能 。 


练习 8.8 编写 函数 bfree(p, n)， 释 放 一 个 包含 n 个 字符 的 任意 块 p， 并 
将 它 放 入 由 malloc 和 free 维护 的 空闲 块 链 表 中 。 通 过 使 用 bfree， 用 户 
可 以 在 任意 时 刻 癌 空闲 块 链表 中 添加 一 个 静态 或 外 部 数组 。 





附录 A 参考 手册 
A.1 引言 


本 手册 描述 的 C 语言 是 1988 年 10 月 31 日 提交 给 ANSI 的 草案 ， 批 准 
号 为 "美国 国家 信 县 系统 标准 一 一 C 程序 设计 语言 ，X3.159*1989"。 尺 
管 我 们 已 尽 最 大 努力 ， 力 求 准确 地 将 该 手 册 作 为 C 语言 的 指南 介绍 给 
读者 ， 但 它 毕竟 不 是 标准 本 身 ， 而 仅仅 只 是 对 标准 的 一 个 解释 而 已 。 


该 手册 的 组 织 与 标准 基本 类 似 ， 与 本 书 的 第 1 版 也 类 似 ， 但 是 对 细节 的 
组 织 有 些 不 同 。 本 手册 给 出 的 语法 与 标准 是 相同 的 ， 但 是 ， 其 中 少量 
元 和 际 的 命名 可 能 有 些 不同 ， 词 法 记号 和 预 处 理 右 的 定义 也 没有 形式 
Mh 

















本 手册 中 ， 说 明 部 分 的 文字 指出 了 ANSI 标准 C 语言 与 本 书 第 1 版 定义 
的 C 语言 或 其 它 编译 露 支 持 的 语言 之 间 的 兰 别 。 


A.2 词法 规则 


程序 由 存储 在 文件 中 的 一 个 或 多 个 翻译 单元 (translation unit) 组 成 。 程 序 
的 翻译 分 几 个 阶段 完成 ， 这 部 分 内 容 将 在 A.12 节 中 介绍 。 翻 译 的 第 一 
阶段 完成 低级 的 词法 转换 ， 执 行 以 字 符 # 开 头 的 行 中 的 指令 ， 并 进行 宏 
SS 在 预 处 理 ( 将 在 A.12 节 中 介绍 ) 完 成 后 ， 程序 被 归 约 成 
一 个 记号 序列 。 


A.2.1 ws 

C 语言 中 共有 6 Rid SAT. KEF AE APR TRE EAN 
和 其 它 分 隔 符 。 空格 ， 横 辐 制 表 符 和 纵 回 制 表 符 、 换 行 符 ， 换 页 符 和 
注释 (统称 空 日 符 ) 在 程序 中 仅 用 来 分 隔 记 号 ， 因 此 将 被 忽略 。 相 邻 的 标 
识 从 、 关 键 字 和 常量 之 则 需要 用 空白 符 来 分 隔 。 


如 林 到 茶 一 字符 为 止 的 输入 流 和 被 分 隔 成 在 干 记号 ， 那 么 ， 下 一 个 记号 束 
是 后 续 字 符 序 列 中 可 能 构成 记号 的 最 长 的 字符 串 。 


A.2.2 注释 
































注释 以 字符 /* 开 始 ， 以 %/ 结 束 。 注 释 不 能 够 嵌 套 ， 也 不 能 够 出 现在 字符 
串 字面 值 或 字符 字面 值 中 。 





A.2.3 标识 符 


标识 符 是 由 字母 和 数字 构成 的 序列 。 第 一 个 字符 必须 是 字母 ， 下 划 线 “ 
_" 也 被 看 成 是 字 母 。 大 写字 母 和 小 写字 和 母 是 不 同 的 。 标 识 符 可 以 为 任意 
长 度 。 对 于 内 部 标识 符 来 说 ， 至 少 前 31 个 字母 是 有 效 的 ， 在 茶 些 实现 
中 ， 有 效 的 字符 数 可 能 更 多 。 内 部 标识 符 包括 预 处 理 器 的 宏 名 和 其 它 
所 有 没有 外 部 连接 (参见 A.11.2 市 ) 的 名 字 。 带 有 外 部 连接 的 标识 生 的 限 
制 更 严格 一 些 ， 实 现 可 能 只 认为 这 些 标识 符 的 前 6 个 字符 是 有 效 的 ， 
而 且 有 可 能 忽略 大 小 写 的 不 同 。 


A.2.4 关键 宇 
下 列 标识 符 被 保留 作为 关键 字 ， 且 不 能 用 于 其 它 用 途 : 























某 些 实现 还 把 fortran 和 日 asm 保留 为 关键 字 。 


说 明 : 关 键 字 const、signed 和 volatile 是 ANSI 标准 中 新 增加 的 ;enum 和 
void 是 第 1 版 后 新 增加 的 ， 现 已 被 广泛 应 用 ;entry 曾经 被 保留 为 关键 字 
但 从 未 被 使 用 过 ， 现 在 已 经 不 是 了 。 


A.2.5 常量 


和 常量 有 多 种 类 型 。 每 种 类 型 的 常量 都 有 一 个 数据 类 型 。 基 本 数据 类 型 将 
在 A.4.2 节 讨 论 。 常量 : 











整 型 常量 字符 常量 浮 点 常量 枚 举 常量 
1. 整 型 常量 


整 型 常量 由 一 串 数字 组 成 。 如 果 它 以 数字 0 开头 ， 则 为 八进制 数 ， 人 否则 
为 十 进 制 数 。 八 进 制 常量 不 包括 数字 8 和 9， 以 0x 和 0X 开头 的 数字 
序列 表示 十 六 进 制 数 ， 十 六 进 制 数 包含 从 a( 或 A) 到 (Gk 有 的 字母 ， 它 
们 分 别 表示 数值 10 到 15。 


整 型 肖 量 大 以 了 学 母 u 或 U 为 后 缀 ， 则 表示 它 是 一 个 无 符号 数 ;在 以 字母 1 
或 工 Aa, 则 表示 它 是 一 个 长 整 型 数 ; 符 以 字母 UL 为 后 级 ， 则 表示 
它 是 一 个 无 符 写 长 整 型 数 。 


整 型 肖 量 的 类 型 同 它 的 形式 、 值 和 后 级 有 关 ( 有 关 类 型 的 讨论 ， 参 见 A.4 
市 )。 如 果 它 没有 后 级 且 是 十 进 制 表 示 ， 则 其 类 型 很 可 能 是 int. long int 
或 unsigned long int。 如 

















果 它 没有 后 级 且 是 八进制 或 十 六 进 制 表 示 ， 则 其 类 型 很 可 能 是 int、 
unsigned int. long int 或 unsigned long int。 如 果 它 的 后 级 为 u 或 U， 则 
其 类 型 很 可 能 是 unsigned int 或 ungigned long int。 如 果 它 的 后 级 为 1 或 
L， 则 其 类 型 很 可 能 是 long int 或 unsigned long int。 


说 明 :ANSI mEt, 量 的 类 型 比 第 1 版 要 复杂 得 多 。 在 第 1 版 
中 ， 大 的 整 型 常 o U 后 级 是 新 增加 的 。 








2， 字符 常量 


字符 第 量 是 用 蛙 引 号 引起 来 的 一 个 或 多 个 字符 构成 的 序列 ， 如 和 x'。 单 字 
和 从 常量 的 值 是 执 行 时 机 器 字符 集中 此 字符 对 应 的 数值 ， 多 字符 第 量 的 
值 由 具体 实现 定义 。 











字符 常量 不 包括 字符 和 换行 符 ， 可 以 使 用 以 下 转 义 字符 序列 表示 这 些 字 
符 以 及 其 它 一 些 字符 : 





啊 铃 从 BEL "| | | 


转 义 序列 \ooo 由 反 斜 杠 后 跟 1 个、2 个 或 3 个 八进制 数字 组 成 ， 这 些 八 
进 制 数字 用 来 指 定 所 期 望 的 字符 的 值 。\0( 其 后 没有 数字 ) 便 是 一 个 常见 
的 例子 ， 它 表示 字符 NUL。 转 义 序 列 \xhh 中 ， 反 和 斜 杠 后 面 紧 跟 x 以 及 
十 六 进 制 数字 ， 这 些 十 六 进 制 数 用 来 指定 所 期 望 的 字符 的 值 。 数 字 的 
个 数 没 有 限制 ， 但 如 果 字 符 值 超过 最 大 的 字符 值 ， 该 行为 是 未 定义 的 。 
对 于 八 进 制 或 十 六 进 制 转 义 字符 ， 如 条 实现 中 将 类 型 char 看 做 是 带 符 
号 的 ， 则 将 对 字符 值 进行 符号 扩 展 ， 就 好 像 它 被 强制 转换 为 char 类 型 
0 E E T 
义 的 。 


在 C 语 言 的 条 些 实现 中 ， 还 有 一 个 扩展 的 字符 集 ， 它 不 能 用 char 类 型 
表示 。 扩 展 集中 的 币 量 要 以 一 个 前 导 符 工 开头 (例如 Lx’. ), MARS 
符 常 量 。 这 种 常量 的 类 型 为 wchar to 这 是 一 种 整 型 类 型 ， 定 义 在 标准 
头 文件 <stddef.h> 中 。 与 通常 的 字符 第 量 一 样 ， 宽 字符 常量 可 以 使 用 八 
进 制 或 十 六 进 制 转 义 字符 序列 ;但 是 ， 如 果 值 超过 wchar_t 可 以 表示 的 范 
Hl, 则 结果 是 未 定义 的 。 


说 明 : 茶 些 转 义 序 列 是 新 增加 的 ， 特 别 是 十 六 进 制 字符 的 表示 。 扩 展 字 
符 也 是 新 增加 的 。 通常 情况 下 ， 美 国 和 西欧 所 用 的 字符 集 可 以 用 char 
类 型 进行 编码 ， 增 加 wchar t 的 主要 目的 是 为 了 表示 亚洲 的 语言 。 






































3. 浮 点 常量 


浮 点 常量 由 整数 部 分 、 小 数 点 、 小 数 部 分 、 一 个 e 或 E、 一 个 可 选 的 带 
符号 整 型 类 型 的 指 数 和 一 个 可 选 的 表示 类 型 的 后 级 ( 即 f、F、1 或 LL 之 
一 ) 组 成 。 整 数 和 小 数 部 分 均 由 数字 序 列 组 成 。 可 以 没有 整数 部 分 或 小 
数 部 分 (但 不 能 两 者 都 没有 )， 还 可 以 没有 小 数 点 或 者 e 和 指 数 部 分 (但 不 
能 两 者 都 没有 )。 浮 点 常量 的 类 型 由 后 级 确定 ，F 或 f 后 级 表示 它 是 float 
类 型 ;1 或 LL 后 级 表明 它 是 long double 类 型 ;没有 后 级 则 表明 是 double 类 
型 。 











说 明 : 浮 点 常量 的 后 级 是 新 增加 的 。 

4. 枚 举 常 量 

声明 为 枚 举 符 的 标识 符 是 int 类 型 的 常量 (参见 A.8.4 节 )。 
A.2.6 字符 串 字 面值 


字符 串 字 面值 (string ”literal) 也 称 为 字符 串 常量 ， 是 用 双 引 号 引起 来 的 
一 个 字符 序列 ， 如 “...”。 人 字符 串 的 类 型 为 "字符 数组 "， 存 储 类 为 
static( 参 见 A.4 市 )， 它 使 用 给 定 的 字符 进行 初始 化 。 对 相同 的 字符 串 字 
面值 是 否 进 行 区 分 取决 于 具体 的 实现 。 如 果 程 序 试 图 修改 字 符 串 字面 
值 ， 则 行为 是 未 定义 的 。 


我 们 可 以 把 相 邻 的 字符 串 字 面值 连接 为 一 个 单一 的 字符 串 。 执 行 任何 连 
接 操作 后 ， 都 将 在 字符 串 的 后 面 增加 一 个 空 字 节 \0， 这 样 ， 扫 描 字 符 串 
的 程序 便 可 以 找到 字符 串 的 结束 位 置 。 字符 串 字 面值 不 包含 换行 符 和 
双 引 号 字符 ， 但 可 以 用 与 字符 常量 相同 的 转 义 字符 序列 表示 它 们 。 


与 字符 常量 一 样 ， 扩 展 字 符 集中 的 字符 串 字 面值 也 以 前 导 符 L 表示， 如 
L"..."。 宽 字符 字符 串 字 面值 的 类 型 为 < wchar t 类 型 的 数组 "。 将 普通 
字符 串 字 面值 和 宽 字 符 字 符 串 字面 值 进行 连接 的 行为 是 未 定义 的 。 

说 明 : 下 列 规定 都 是 ANSI 标准 中 新 增加 的 :字符 串 字 面值 不 必 进 行 区 
分 、 禁 止 修改 字符 串 字 面值 以 及 允许 相 邻 字符 串 字 面值 进行 连接 。 帘 
字符 字符 串 字 面值 也 是 ANSI 标准 中 新 增加 的 。 

A.3 语法 符号 


在 本 手册 用 到 的 语法 符号 中 ， 语 法 类 别 用 楷体 及 斜体 字 表 示 。 文 字 和 字 
从 以 打字 型 字体 表 不 。 多 个 候选 类 别 通常 列 在 不 同 的 行 中 ， 但 在 一 些 
情况 下 ， 一 组 字符 长 度 较 短 的 候选 页 可 以 放 在 一 行 中 ， 并 以 短语 “ one 
of" 标 识 。 可 选 的 终结 符 或 非 终 结 符 融 有 下 标 * opt"。 例 如 : 


{ 表达 式 |} 
表示 一 个 括 在 花 括号 中 的 表达 式 ， 该 表达 式 是 可 选 的 。A.13 市 对 语法 












































进行 了 总 结 。 说 明 : 与 本 书 第 1 版 给 出 的 语法 所 不 同 的 是 ， 此 处 给 出 的 
语法 将 表达 式 运 算 符 的 优先 级 


和 结合 性 显 式 表达 出 来 了 。 
AA 标识 从 的 含义 


标识 符 也 称 为 名 字 ， 可 以 指 代 多 种 实体 :函数 、 结 构 标 记 、 联 合 标记 和 
枚 举 标记 ;结构 成 员 或 联合 成 员 ; 枚 举 第 量 ;类 型 定义 名 ; 标 写 以 及 对 象 
等 。 对 象 有 时 也 称 为 变量 ， 它 是 一 个 存储 位 置 。 对 它 的 解释 依赖 于 两 
个 主要 属性 :存储 类 和 类 型 。 存 储 类 决定 了 与 该 标识 对 象 相关 联 的 存储 
区 域 的 生存 期 ， 类 型 决定 了 标识 对 象 中 值 的 含义 。 名 字 还 具有 一 个 作用 
域 和 一 个 连接 。 作 用 域 即 程序 中 可 以 访问 此 名 字 的 区 域 ， 连 接 决 定 妃 
一 作用 域 中 的 同一 个 名 字 是 否 














指 回 同一 个 对 象 或 函数 。 作 用 域 和 连接 将 在 A.11 节 中 讨论 。 
A.4.1 存储 类 


存储 类 分 为 两 类 :自动 存储 类 (automatiC 〇 和 静态 存储 类 (statiO 〇 。 声 明 对 象 
时 使 用 的 一 些 关 键 字 和 声明 的 上 下 文 共 同 决 定 了 对 象 的 存储 类 。 目 动 
存储 类 对 象 对 于 一 个 程序 块 (参见 A.9.3 节 ) 来 说 是 局 部 的 ， 在 退出 程序 
BRIN TART BRI A o 如 果 没 有 使 用 存储 类 说 明 符 ， 或 者 如 果 使 用 了 
auto 限定 符 ， 则 程序 块 中 的 声明 生成 的 都 是 自动 存储 类 对 象 。 声 明 为 
register 的 对 象 也 是 自动 存储 类 对 象 ， 并 且 将 被 存储 在 机 占 的 快速 寄存 
器 中 (如 果 可 能 的 话 )。 


静态 对 象 可 以 是 条 个 程序 块 的 局 部 对 象 ， 也 可 以 是 所 有 程序 块 的 外 部 对 
象 。 无 论 是 哪 一 种 情况 ， 在 退出 和 再 进入 函数 或 程序 块 时 其 值 将 保持 
不 变 。 在 一 个 程序 块 (包括 提供 函数 代 码 的 程序 块 ) 内 ， 静 态 对 象 用 关键 
F static FWY. FEAT A PEPER Ab aD Fs HA eR BE SCTE 同一 级 的 对 象 总 
古 静 态 的 。 可 以 通过 static 关键 字 将 对 象 声 明 为 东 个 特定 翻译 单元 的 局 
部 对 象 ， 这 种 类 型 的 对 象 将 具有 内 部 连接 。 当 省 略 显 式 的 存储 类 或 通 
过 关键 字 extern 进行 声 明 时 ， 对 象 对 整个 程序 来 说 是 全 局 可 访问 的 ， 
并 且 具 有 外 部 连接 。 


A.4.2 基本 类 型 


基本 类 型 包括 多 种 。 附 录 B 中 描述 的 标准 头 文件 <limits.h> 中 定义 了 本 
a E 
ZIRE. 


声明 为 字符 (chan 的 对 象 要 大 到 足以 存储 执行 字符 集中 的 任何 字符 。 如 
果 字 符 集中 的 某 个 字符 存储 在 一 个 char 类 型 的 对 象 中 ， 则 该 对 象 的 值 
等 于 字符 的 整 型 编码 值 ， 并 且 是 非 负 值 。 其 它 类 型 的 对 象 也 可 以 存储 
在 char 类 型 的 变量 中 ， 但 其 取 值 范围 ， 特 别 是 其 值 是 否 带 符 写 ， 同 具 
体 的 实现 有 关 。 


以 unsigned char 声明 的 无 符号 字符 与 普通 字符 占用 同样 大 小 的 空间 ， 但 
其 值 总 是 非 负 的 。 以 Signed char BRE 明 的 市 符号 字符 与 普通 字符 也 
占用 同样 大 小 的 空 HO 




































































说 明 : 本 书 的 第 1 版 中 没有 unsi gned char 类 型 ， 但 这 种 用 法 很 常见 。si 
gned char 是 新 增加 的 。 


除 char 类 型 外 ， 还 有 3 种 不 同 大 小 的 整 型 类 型 :short int. int 和 long 
int。 普 通 int 对 象 的 长 度 与 由 宿主 机 器 的 体系 结构 决定 的 自然 长 度 相 
同 。 其 它 类 型 的 整 型 可 以 满足 各 种 特殊 的 用 途 。 较 长 的 整数 至 少 要 占 
有 与 较 短 整 数 一 样 的 存储 空间 ;但 是 具体 的 实现 可 以 使 得 一 般 整 型 (int) 
与 短 整 型 (short int) 或 长 整 型 ong int) 具 有 同样 的 大 小 。 除非 特别 说 明 ， 
int 类 型 都 表示 融和 从 号 数 。 


以 关键 字 unsigned 声明 的 无 符号 整数 遵守 算术 模 2" 的 规则 ， 其 中 ，n 是 
表示 相应 整数 的 二 进 制 位 数 ， 这 样 ， 对 无 符号 数 的 算术 运算 永远 不 会 
溢出 。 可 以 存储 在 带 符号 对 象 中 的 非 负 值 的 集合 是 可 以 存储 在 相应 的 
无 符号 对 象 中 的 值 的 对 集 ， 并 且 ， 这 两 个 集合 的 重重 部 分 的 ATAN 


单 精度 浮 点 数 (float)、 双 精度 浮 点 数 (double) 和 多 精度 浮 点 数 (long 
double) 中 的 任何 类 型 都 可 能 是 同 义 的 ， 但 精度 从 前 到 后 是 递增 的 。 











说 明 :1 ong doubl e 是 新 增加 的 类 型 。 在 第 1 版 中 ，l1ongfloat doubl e 
类 型 等 价 ， 但 现在 是 不 相同 的 。 

枚 举 是 一 个 具有 整 型 值 的 特殊 的 类 型 。 与 每 个 枚 举 相 关联 的 是 一 个 命名 
常量 的 集合 ( 参 见 A.8.4 市 )。 枚 举 类 型 类 似 于 整 型 。 但 是 ， 如 果 某 个 特 
定 枚 举 类 型 的 对 象 的 赋值 不 是 其 常量 中 的 一 个 ， 或 者 赋值 不 是 一 个 同 
类 型 的 表达 式 ， 则 编译 器 通常 会 产生 警告 信息 。 

因为 以 上 这 些 类 型 的 对 象 都 可 以 被 解释 为 数字 ， 所 以 ， 可 以 将 它们 统称 
为 算术 类 型 。char 类 型 、 各 种 大 小 的 int 类 型 (无 论 是 否 带 符号 ) 以 及 枚 举 
类 型 都 统称 为 整 型 类 型 (integral type). 类 型 float、double 和 long double 
统称 为 浮 点 类 型 (floating type)。 


void 类 型 说 明 一 个 值 的 空 集合 ， 它 常 被 用 来 说 明 不 返回 任何 值 的 函数 的 


ZEA 
A.4.3 派生 类 型 


除 基 本 类 型 外 ， 我 们 还 可 以 通过 以 下 几 种 方法 构造 派生 类 型 ， 从 概念 来 
讲 ， 这 些 派生 类 型 可 以 有 无 限 多 个 : 


给 定 类 型 对 象 的 数组 
返回 给 定 类 型 对 象 的 函数 
指向 给 定 类 型 对 象 的 指针 
包含 一 系列 不 同类 型 对 象 的 结构 
可 以 包含 多 个 不 同类 型 对 象 中 任意 一 个 对 象 的 联合 
一 般 情况 下 ， 这 些 构造 对 象 的 方法 可 以 递归 使 用 。 
A.4.4 类 型 限定 符 
对 象 的 类 型 可 以 通过 附加 的 限定 符 进 行 限 定 。 声 明 为 const 的 对 象 表明 


此 对 象 的 值 不 可 以 修改 ;声明 为 volatile 的 对 象 表明 它 具 有 与 优化 相关 的 
特殊 属性 。 限 定 符 既 不 影响 对 象 取 值 的 范围 ， 也 不 影响 其 算术 属性 。 


























限定 符 将 在 A.8.2 节 中 讨论 。 
A.5 对 象 和 左 值 


对 象 是 一 个 命名 的 存储 区 域 ， 左 值 (lvalue) 是 引用 某 个 对 象 的 表达 式 。 具 
有 合适 类 型 与 存储 类 的 标识 符 便 是 左 值 表达 式 的 一 个 明显 的 例子 。 茶 
些 运 算 符 可 以 产生 左 值 。 例 如 ， 如 果 下 是 一 个 指针 类 型 的 表达 式 ，: 
则 是 一 个 左 值 表达 式 ， 它 引用 由 王 指 向 的 对 象 。 名 字 " 左 值 > 来 源 于 赋 
值 表达 式 E1=E2， 其 中 ， 左 操作 数 EL 必须 是 一 个 左 值 表 达 式 。 对 每 个 
运算 符 的 讨论 需要 说 明 此 运算 符 是 否 需 要 一 个 左 值 操作 数 以 及 它 是 否 
peda Ae 


A.6 转换 


根据 操作 数 的 不 同 ， 茶 些 运算 符 会 引起 操作 数 的 值 从 某 种 类 型 转换 为 忆 
PRA, A 将 说 明 这 种 转换 产生 的 结果 。A.6.5 节 将 讨论 大 多 数 普 
通 运算 符 所 要 求 的 转换 ， 我 们 在 讲解 每 




















个 运算 符 时 将 做 一 些 补 充 。 
A.6.1 整 型 提升 


在 一 个 表达 式 中 ， 凡 是 可 以 使 用 整 型 的 地 方 都 可 以 使 用 带 符号 或 无 符号 
的 字符 、 短 整 型 或 整 型 位 字段 ， 还 可 以 使 用 枚 举 类 型 的 对 象 。 如 果 原 
始 类 型 的 所 有 值 都 可 用 int 类 型 表示 ， 则 其 值 将 被 转换 为 int 类 型 ;否则 
将 被 转换 为 unsigned int 类型。 这 一 过 程 称 为 整 型 提 Ft (integral 


promotion). 
A6.2 整 型 转换 


将 任何 整数 转换 为 茶 种 指定 的 无 符号 类 型 数 的 方法 是 :以 该 无 符号 类 型 
能 够 表示 的 最 大 值 加 1 为 模 ， 找 出 与 此 整数 同 余 的 最 小 的 非 负 值 。 在 
对 二 的 补 码 表示 中 ， 如 果 该 无 符号 类 型 的 位 模式 较 罕 ， 这 就 相当 于 磊 
截取 ;如 果 该 无 符号 类 型 的 位 模式 较 宽 ， 这 束 相 当 于 对 带 符号 值 进行 符 
号 扩展 和 对 无 符号 值 进行 0 填充 。 


将 任何 整数 转换 为 带 符 号 类 型 时 ， 如 果 它 可 以 在 新 类 型 中 表示 出 来 ， 则 
其 值 保 持 不 变 ， 否则 它 的 值 同 具体 的 实现 有 关 。 


A.6.3 整数 和 浮 点 数 


当 把 浮 扣 类 型 的 值 转换 为 整 型 时 ， 小 数 部 分 将 被 丢弃 。 如 果 结 果 值 不 能 
用 整 型 表示 ， 则 其 行为 是 未 定义 的 。 特 别 是 ， 将 负 的 浮 点 数 转 换 为 无 
符号 整 型 的 结果 是 没有 定义 的 。 


当 把 整 型 值 转换 为 浮 点 类 型 时 ， 如 果 该 值 在 该 浮 点 类 型 可 表示 的 范围 内 
但 不 能 精确 表示 ， 则 结果 可 能 是 下 一 个 较 高 或 较 低 的 可 表示 值 。 如 有 宋 
该 值 超出 可 表示 的 范围 ， 则 其 行为 是 未 定 义 的 。 


A.6.4 浮 点 类 型 


将 一 个 精度 较 低 的 浮 点 值 转换 为 相同 或 更 高 精度 的 浮 点 类 型 时 ， 它 的 值 
保持 不 变 。 将 一 个 较 高 精度 的 浮 点 类 型 值 转换 为 较 低 精度 的 浮 点 类型 
时 ， 如 果 它 的 值 在 可 表示 范围 内 ， 则 结 果 可 能 是 下 一 个 较 高 或 较 低 的 
可 表示 值 。 如 果 结 果 在 可 表示 范围 之 外 ， 则 其 行为 是 未 定义 的 。 



































A.6.5 算术 类 型 转换 


许多 运算 符 都 会 以 类 似 的 方式 在 运算 过 程 中 引起 转换 ， 并 产生 结果 类 
型 。 其 效果 是 将 所 有 操作 数 转 换 为 同一 公共 类 型 ， 并 以 此 作为 结果 的 
类 型 。 这 种 方式 的 转换 称 为 普通 算术 类 型 转换 。 


首先 ， 如 果 任 何 一 个 操作 数 为 long double 类 型 ， 则 将 另 一 个 操作 数 转 
换 为 long double 类 型 。 











否则， 如 果 任 何 一 个 操作 数 为 double 类 型 ， 则 将 另 一 个 操作 数 转换 为 
double 类 型 。 


否则 ， 如 果 任 何 一 个 操作 数 为 float 类 型 ， 则 将 另 一 个 操作 数 转 换 为 
float 类 型 。 否则 ， 同 时 对 两 个 操作 数 进行 整 型 提升 ;然后 ， 如 果 任 何 一 
个 操作 数 为 unsigned long 


int 类 型 ， 则 将 男 一 个 操作 数 转换 为 unsigned long int KW, 


否则， 如 果 一 个 操作 数 为 long int 类 型 且 另 一 个 操作 数 为 unsigned int 类 
型 ， 则 结果 依赖 于 long int 类 型 是 否 可 以 表示 所 有 的 unsigned int 类 型 
的 值 。 如 果 可 以 ， 则 unsigned int 类 型 的 操作 数 转换 为 long int; u R 
不 可 以 ， 则 将 两 个 操作 数 都 转换 为 unsigned long int 类 型 。 


人 否则， 如 果 一 个 操作 数 为 long int 类 型 ， 则 将 男 一 个 操作 数 转换 为 long 
int 类 型 。 否则 ， 如 果 任 何 一 个 操作 数 为 unsigned int 类 型 ， 则 将 男 一 个 
操作 数 转换 为 unsigned 


int 类 型 。 

人 否则， 将 两 个 操作 数 都 转换 为 int 类 型 。 

说 明 :这 里 有 两 个 变化 。 第 一 ， 对 float 类 型 操作 数 的 算术 运算 可 以 只 用 
单 精 度 而 不 是 双 精 度 ;而 在 第 1 版 中 规定 ， 所 有 的 浮 点 运算 都 是 双 精 
度 。 第 二 ， 当 较 短 的 无 符号 类 型 与 较 

长 的 带 符号 类 型 一 起 运算 时 ， 不 将 无 符号 类 型 的 属性 传递 给 结果 类 型 ; 
而 在 第 1 版 中 ， 无 符 号 类 型 总 是 处 于 支配 地 位 。 新 规则 稍微 复杂 一 
些 ， 但 减少 了 无 符号 数 与 带 符号 数 混 合 使 用 情 况 下 的 麻烦 ， 当 一 个 无 
符号 表达 式 与 一 个 具有 同样 长 度 的 带 符号 表达 式 相 比较 时 ， 结 果 仍 然 
是 无 法 预料 的 。 

A.6.6 指针 和 整数 


指针 可 以 加 上 或 减 去 一 个 整 型 表达 式 。 在 这 种 情况 下 ， 整 型 表达 式 的 转 
换 按照 加 法 运算 符 的 方式 进行 (参见 A.7.7 节 )。 


两 个 指 问 同一 数组 中 同一 类 型 的 对 象 的 指针 可 以 进行 减法 运算 ， 其 结果 
































将 被 转换 为 整 型 ; 转换 方式 按照 减法 运算 符 的 方式 进行 (参见 A.7.7 节 )。 


值 为 0 的 整 型 常量 表达 陈 或 强制 转换 为 void * 类 型 的 表达 式 可 通过 强制 
转换 、 赋 值 或 比 较 操 作 转 换 为 任意 类 型 的 指针 。 其 结果 将 产生 一 个 空 
指针 ， 此 空 指针 等 于 指 回 同一 类 型 的 另 一 空 指针 ， 但 不 等 于 任何 指 问 
函数 或 对 象 的 指针 。 


还 允许 进行 指针 相关 的 其 它 某 些 转换 ， 但 其 结果 依赖 于 具体 的 实现 。 这 
些 转换 必须 由 一 个 显 式 的 类 型 转换 运算 符 或 强制 类 型 转换 来 指定 (参见 
A.7.5 节 和 A.8.8 节 )。 


指针 可 以 转换 为 整 型 ， 但 此 整 型 必须 足够 大 ;所 要 求 的 大 小 依赖 于 具体 
的 实现 。 映 射 函 数 也 依赖 于 具体 的 实现 。 


整 型 对 象 可 以 显 式 地 转换 为 指针 。 这 种 映射 总 是 将 一 个 足够 宽 的 从 指针 
转换 来 的 整数 转 换 为 同一 个 指针 ， 其 它 情况 依赖 于 具体 的 实现 。 


指 问 某 一 类 型 的 指针 可 以 转换 为 指 疝 为 一 类 型 的 指针 ， 但 是 ， 如 果 该 指 
针 指 向 的 对 象 不 满足 一 定 的 存储 对 齐 要 求 ， 则 结果 指针 可 能 会 导致 地 
址 异常 。 指 同人 条 对 象 的 指针 可 以 转换 为 一 个 指名 具有 更 小 或 相同 存储 
对 齐 限 制 的 对 象 的 指针 ， 并 可 以 保证 原封 不 动 地 再 转换 回来 。 




















"对 齐 " 的 概念 依赖 于 具体 的 实现 ， 但 char 类 型 的 对 象 具 有 最 小 的 对 齐 限 
制 。 我 们 将 在 A.6.8 


T einen Serta 
回来 。 


一 个 指针 可 以 转换 为 同类 型 的 另 一 个 指针 ， 但 增加 或 删除 了 指针 所 指 的 
对 象 类 型 的 限定 符 (参见 A.4.4 节 和 A.8.2 节 ) 的 情况 除外 。 如 果 增 加 了 
限定 符 ， 则 新 指针 与 原 指 针 等 价 ， 不 同 的 是 增加 了 限定 符 带 来 的 限 
pag 则 对 底层 对 象 的 运算 仍 受 实际 声明 中 的 限定 
符 的 限制 。 


最 后 ， 指 同一 个 函数 的 指针 可 以 转换 为 指 回 另 一 个 函数 的 指针 。 调 用 转 
换 后 指针 所 指 的 函数 的 结果 依赖 于 具体 的 实现 。 但 是 ， 如 采 转 换 后 的 
旨 针 被 重新 转换 为 原来 的 类 型 ， 则 结果 与 原来 的 指针 一 致 。 


A.6.7 void 


void X AH (AFF TE MELAS Be i DAE a SEA, te Be sh Beat 
地 转换 为 任 一 非 空 类 型 。 因 为 空 (void) 表 达 式 表示 一 个 不 存在 的 值 ， 这 
样 的 表达 式 只 可 以 用 在 不 需要 值 的 地 方 ， 例 如 作为 一 个 表达 式 语 句 ( 参 
见 A.9.2 节 ) 或 作为 去 号 运算 符 的 左 操作 数 (参见 A.7.18 市 )。 


可 以 通过 强制 类 型 转换 将 表达 式 转换 为 void 类 型 。 例 如 ， 在 表达 式 语 
名 中， 一 个 空 的 强 制 类 型 转换 将 丢 挥 函数 调用 的 返回 值 。 


说 明 :void 没有 在 本 书 的 第 1 版 中 出 现 ， 但 是 在 本 书 第 1 版 出 版 后 ， 它 
一 直 被 广泛 使 用 着 。 

A.6.8 指向 void 的 指针 

指向 任何 对 象 的 指针 都 可 以 转换 为 void * 类 型 ， 明 不 会 丢失 信息 。 如 果 
将 结果 再 转换 为 初始 指针 类 型 ， 则 可 以 恢复 初始 指针 。 我 们 在 A.6.6 节 
中 讨论 过 ， 执 行 指针 到 指针 的 转换 时 ， 一 般 需 要 显 式 的 强制 转换 ， 这 
里 所 不 同 的 是 ， 指 针 可 以 被 赋值 为 void * 类 型 的 指针 ， 也 可 以 赋值 给 
void * 类 型 的 指针 ， 并 可 与 void * 类 型 的 指针 进行 比较 。 


说 明 :对 void * 指 针 的 解释 是 新 增加 的 。 以 前 ，char * 指 针 扮 沉着 通用 指 




















针 的 角色 。 ANSI 标准 特别 允许 void * 类 型 的 指针 与 其 它 对 象 指针 在 赋 
值 表达 式 和 关系 表达 式 中 混用 ， 而 对 其 它 类 型 指针 的 混用 则 要 求 进行 
显 式 强制 类 型 转换 。 


A.7 表达 式 


本 节 中 各 主要 小 市 的 顺序 就 代表 了 表达 式 运 算 符 的 优先 级 ， 我 们 将 依次 
按照 从 高 到 低 的 优先 级 介绍 。 举 个 例子 ， 按 照 这 种 关系，A.7.1 至 A.7.6 
节 中 定义 的 表达 式 可 以 用 作 加 法 运算 符 +( 参 见 A.7.7 市 ) 的 操作 数 。 在 

每 一 小 市 中 ， 各 个 运算 符 的 优先 级 相同 。 每 个 小 节 中 还 将 讨论 该 市 涉 

及 到 的 运算 符 的 左 、 右 结合 性 。A.13 节 中 给 出 的 语法 综合 了 运算 符 的 

优先 级 和 结 合 性 。 


运算 符 的 优先 级 和 结合 性 有 明确 的 规定 ， 但 是 ， 除 少数 例外 情况 外 ， 表 
达 式 的 求 值 次 序 











没有 定义 ， 甚 至 某 些 有 副作用 的 子 表达 式 也 没有 定义 。 也 就 是 说 ， 除 非 
运算 符 的 定义 保证 了 其 操作 数 按 某 一 特定 顺序 求 值 ， 否 则 ， 有 具体 的 实 
现 可 以 自由 选择 任 一 求 值 次 序 ， 甚 至 可 以 交 换 求 值 次 序 。 但 是 ， 每 个 
运算 答 将 其 操 作 数 生成 的 值 结 全 起 来 的 方式 与 表达 式 的 语法 分 析 方 式 
是 兼容 的 。 


说 明 : 该 规则 废除 了 原先 的 一 个 规则 ， 即 : 当 表 达 式 中 的 运算 符 在 数学 上 
满足 交换 律 和 结合 律 时 ， 可 以 对 表达 式 重 新 排序 ， 但 是 ， 在 计算 时 可 
能 会 不 满足 结合 律 。 这 个 改变 仅 影 响 浮 点 数 在 接近 其 精度 限制 时 的 计 
算 以 及 可 能 发 生 洪 出 的 情况 。 

C 语言 没有 定义 表达 式 求 值 过 程 中 的 游 出 、 除 法 检查 和 其 它 异常 的 处 
理 。 大 多 数 现 有 C 语言 的 实现 在 进行 带 符号 整 型 表达 式 的 求 值 以 及 赋值 
时 忽略 溢出 异常 ， 但 并 不 是 所 有 的 实现 都 这 么 做 。 对 除数 为 0 和 所 有 
浮 点 异常 的 处 理 ， 不 同 的 实现 采用 不 同 的 方式 ， 有 了 时候 可 以 用 非 标 准 
库 函 数 进行 调整 。 

A.7.1 指针 生成 

对 于 某 类 型 T， 如 果菜 表达 式 或 子 表 达 式 的 类 型 为 “TT 类 型 的 数组 "， 则 
此 表达 式 的 值 是 指向 数组 中 第 一 个 对 象 的 指针 ， 并 且 此 表达 式 的 类 型 
将 被 转换 为 "指向 工 类 型 的 指针 "。 如 果 此 表达 式 是 一 元 运算 符 & 或 
sizeof， 则 不 会 进行 转换 。 类 似 地 ， 除 非 表 达 式 被 用 作 芭 运算 符 的 操作 
数 ， 和 否则 ， 类 型 为 "返回 工 类 型 值 的 函数 "的 表达 式 将 被 转换 为 "指向 返 
回 工 类 型 值 的 函数 的 指针 "类 型 。 

A.7.2 初等 表达 式 

初等 表达 式 包括 标识 符 、 常 量 、 字 符 串 或 带 括号 的 表达 式 。 

初等 表达 式 : 

标识 符 常量 字符 串 

(表达 式 ) 

如 果 按 照 下 面 的 方式 对 标识 符 进行 适当 的 声明 ， 该 标识 符 就 是 初等 表达 
式 。 其 类 型 由 其 声明 指定 。 如 果 标 识 符 引 用 一 个 对 象 (参见 A.5 节 )， 并 


























且 其 类 型 是 算术 类 型 、 结 构 、 联 合 或 指针， 那么 它 就 是 一 个 左 值 。 


常量 是 初等 表达 式 ， 其 类 型 同 其 形式 有 关 。 更 详细 的 信息 ， 参 见 A.2.5 
节 中 的 讨论 。 字符 串 字面 值 是 初等 表达 式 。 它 的 初始 类 型 为 < char 类 
型 的 数组 "类 型 (对 于 宽 字 符 字 








APH, MA wehar_t 类 型 的 数组 "类 型 )， 但 遵循 A.7.1 节 中 的 规则 。 它 
通常 被 修改 为 " 指 


问 char 类 型 (或 wehar_t 类 型 ) 的 指针 "类 型 ， 其 结果 是 指 癌 字符 串 中 第 一 
个 字符 的 指针 。 


某 些 初始 化 程序 中 不 进行 这 样 的 转换 ， 详 细 人 信息， 参见 A.8.7 节 。 


用 括 写 括 起 来 的 表达 式 是 初等 表达 式 ， 它 的 类 型 和 值 与 无 括号 的 表达 式 
相同 。 此 表达 式 是 否 是 左 值 不 受 括号 的 影响 。 








A.7.3 后 级 表达 式 
后 级 表达 式 中 的 运算 符 遵循 从 左 到 右 的 结合 规则 。 
后 级 表达 式 : 


初等 表达 式 后 级 表达 式 [ 表 达 式 ] 后 级 表达 式 ( 参 数 表 达 式 表 ,,) 后 级 表 
达 式 .标识 符 后 级 表达 式 ,> 标 识 符 后 级 表达 式 ++ 后 级 表达 式 *。 


参数 表达 式 表 : 赋值 表达 式 
参数 表达 式 表 , 赋值 表达 式 


1 数组 引用 带 下 标的 数组 引用 后 级 表达 式 由 一 个 后 级 表达 式 后 跟 一 个 括 
在 方 括号 中 的 表达 式 组 成 。 


方 括号 前 的 后 绥 表 达 陈 的 类 型 必须 为 " 指 癌 工 类 型 的 指针 "， 其 中 了 为 某 
种 类 型 ; 方 括 号 中 表 

达 式 的 类 型 必须 为 整 型 。 结 果 得 到 下 标 表达 式 的 类 型 为 T。 表 达 式 
E1[E2] 在 定义 上 等 同 于 

*((E1) + (E2))。 有 关 数 组 引用 的 更 多 讨论 ， 参 见 A.8.6 Ti. 

2 函数 调用 


函数 调用 由 一 个 后 级 表达 式 ( 称 为 函数 标志 符 ，function designator) 后 跟 
由 圆 括 号 括 起 来 的 赋值 表达 式 列 表 组 成 ， 其 中 的 赋值 表达 式 列表 可 能 
NT, FHETT, KERANA 就 是 函数 的 参数 。 如 果 后 级 表 
达 陈 包含 一 个 当前 作用 域 中 不 存在 的 标识 符 ， 则 此 标识 符 将 被 隐 式 地 
声明 ， 等 同 于 在 执行 此 函数 调用 的 最 内 层 程 序 块 中 包含 下 列 声明 : 














extern int 标识 符 () 


该 后 级 表达 式 (在 可 能 的 隐 式 声明 和 指针 生成 之 后 ， 参 见 A.7.1 节 ) 的 类 
型 必须 为 " 指 问 返 回 


T 类 型 的 函数 的 指针 "， 其 中 工 为 条 种 类 型 ， 且 函数 调用 的 值 的 类 型 为 


工 。 


说 明 : 在 第 1 版 中 ， 该 类 型 被 限制 为 "函数 "类 型 并且， 通过 指向 函数 的 

BET Val FX ee 数 时 必须 有 一 个 显 式 的 * 运 算 符 。ANSI 标准 允许 现 有 的 一 
些 编译 占用 同样 的 语法 进行 函数 调 用 和 通过 指向 函数 的 指针 进行 函数 
调用 。 旧 的 语法 仍然 有 效 。 


通常 用 术语 "实际 参数 "表示 传递 给 函数 调用 的 表达 式 ， 而 术语 "形式 参 
数 " 则 用 来 表 示 函 数 定义 或 函数 声明 中 的 输入 对 象 (或 标识 符 )。 


在 调用 函数 之 前 ， 函 数 的 每 个 实际 参数 将 被 复制 ， 所 有 的 实际 参数 严格 
地 按 值 传递 。 函 数 可 能 会 修改 形式 参数 对 象 的 值 ( 即 实 际 参数 表达 式 的 
副本 )， 但 这 个 修改 不 会 影响 实际 参数 的 值 。 但 是 ， 可 以 将 指针 作为 实 
际 参 数 传递 ， 这 样 ， 函 数 便 可 以 修改 指针 指 网 的 对 象 的 值 。 


可 以 通过 两 种 方式 声明 函数 。 在 新 的 声明 方式 中 ， 形 式 参 数 的 类 型 是 显 
式 声明 的 ， 并 且 是 函数 类 型 的 一 部 分 ， 这 种 声明 称 为 函数 原型 。 在 旧 
的 方式 中 ， 不 指定 形式 参数 类 型 。 有 关 函数 声明 的 讨论 ， 参 见 A.8.6 节 
和 A.10.1 节 。 








在 函数 调用 的 作用 域 中 ， 如 果 函 数 是 以 旧 陈 方式 声明 的 ， 则 按 以 下 方式 
对 每 个 实际 参数 进行 默认 参数 提升 :对 每 个 整 型 参数 进行 整 型 提升 (参见 
A.6.1 市 ); 将 每 个 float 类 型 的 参 数 转换 为 double 类 型 。 如 果 调 用 时 实际 
参数 的 数目 与 函数 定义 中 形式 参数 的 数目 不 等 ， 或 者 东 个 实际 参数 的 
类 型 提升 后 与 相应 的 形式 参数 类 型 不 一 致 ， 则 函数 调用 的 结果 是 未 定义 
的 。 类 型 一 致 性 依赖 于 函数 是 以 新 式 方式 定义 的 还 是 以 旧式 方式 定义 
的 。 如 果 是 旧式 的 定义 ， 则 比较 经 提升 后 函数 调用 中 的 实际 参数 类 型 
和 提升 后 的 形式 参数 类 型 ;如 果 是 新 式 的 定义 ， 则 提升 后 的 实际 参数 类 
型 必须 与 没有 提升 的 形式 参数 目 身 的 类 型 保持 一 致 。 


在 函数 调用 的 作用 域 中 ， 如 果 函 数 是 以 新 式 方式 声明 的 ， 则 实际 参数 将 
被 转换 为 函数 原 型 中 的 相应 形式 参数 类 型 ， 这 个 过 程 类 似 于 赋值 。 实 
际 参 数 数目 必须 与 显 式 声 明 的 形式 参数 数目 相同 ， 除 非 函数 声明 的 形 
式 参 数 表 以 省 略 写 (，...) 结 尾 。 在 这 种 情况 下 ， 实 际 参 数 的 数目 必须 等 
于 或 超过 形式 参数 的 数目 ;对 于 尾部 没有 显 式 指定 类 型 的 形式 参数 ， 相 
应 的 实 际 参数 要 进行 默认 的 参数 提升 ， 提 升 方法 同 前 面 所 述 。 如 果 函 
数 是 以 旧式 方式 定义 的 ， 那 么 ， 函数 原型 中 每 个 形式 参数 的 类 型 必须 
与 函数 定义 中 相应 的 形式 参数 类 型 一 致 (函数 定义 中 的 形式 参数 类 型 经 
过 参数 提升 后 )。 


说 明 :这 些 规 则 非 第 复杂， 因为 必须 要 考虑 新 旧式 函数 的 混合 使 用 。 应 
尽 可 能 避免 新 旧 式 函 数 声明 混合 使 用 。 


实际 参数 的 求 值 次 序 没 有 指定 。 不 同 编译 圳 的 实现 方式 各 不 相同 。 但 
是 ， 在 进入 函数 前 ， 实际 参数 和 函数 标志 符 是 完全 求 值 的， 包括 所 有 
的 副作用 。 对 任何 函数 都 多 许 进行 递归 调用 。 


3 结构 引用 后 级 表达 式 后 跟 一 个 加 点 和 一 个 标识 符 仍 是 后 级 表达 式 。 第 
一 个 操作 数 表达 式 的 类 型 必 


须 是 结构 或 联合 ， 标 识 符 必须 是 结构 或 联合 的 成 员 的 名 字 。 结 果 值 是 结 
构 或 联合 中 命名 的 成 


员 ， 其 类 型 是 对 应 成 员 的 类 型 。 如 果 第 一 个 表达 式 古 一 个 左 值 ， 并 且 第 
二 个 表达 式 的 类 型 不 是 数组 类 型 ， 则 整个 表达 式 是 一 个 左 值 。 


后 级 表达 式 后 跟 一 个 第 头 (由 "和 > 组 成 ) 和 一 个 标识 符 仍 是 后 弘 表达 式 。 



































第 一 个 操作 数 表达 式 必 须 是 一 个 指向 结构 或 联合 的 指针 ， 标 识 符 必 须 

是 结构 或 联合 的 成 员 的 名 字 。 结 果 指 向 指针 表达 式 指 辐 的 结构 或 联合 

中 命名 的 成 员 ， 结 果 类 型 是 对 应 成 员 的 类 型 。 如 果 该 类 型 不 是 数组 类 

型 ， 则 结果 是 一 个 左 值 。 

因此 ， 表 达 式 E1.>MOS 与 (*E1).MOS 等 价 。 结 构 和 联合 将 在 A.8.3 节 

中 讨论 。 说明: 在 本 书 的 第 1 版 中 ， 规 定 了 这 种 表达 式 中 成 员 的 名 字 必 
须 属于 后 级 表达 式 指定 的 


结构 或 联合 ， 但 是 ， 该 规则 并 没有 强制 执行 。 最 新 的 编译 器 和 ANSI 标 
准 强 制 执行 了 这 一 规则 。 


4 后 级 自 增 运算 符 与 后 级 上 自 减 运算 符 后 绥 表 达 式 后 跟 一 个 ++ 或 运算 符 
仍 是 一 个 后 级 表达 式 。 表 达 式 的 值 就 是 操作 数 的 值 。 


执行 完 该 表达 式 后 ， 操 作 数 的 值 将 加 1(++) 或 减 1(…)。 操 作 数 必须 是 一 
个 左 值 。 有 关 操 


作 数 的 限制 和 运 拭 细 市 的 详细 信息 ， 参 见 加 法 类 运算 符 (A.7.7 市 ) 和 赋值 
类 运算 从 (A.7.17 


节 ) 中 的 讨论 。 其 结果 不 是 左 值 。 
A.7.4 一 元 运算 符 


带 一 元 运算 符 的 表达 式 遵循 从 右 到 左 的 结合 性 。 

















一 元 表达 式 : 

后 级 表达 式 

++— FERIA HK 

“… 一 元 表达 式 

一 元 运算 符 强制 类 型 转换 表达 式 
sizeoff 一 元 表达 式 
sizeof( 类 型 名 ) 

一 元 运算 符 :one of 

RQ*+e~! 


1 前 级 目 增 运算 符 与 前 级 目 减 运算 符 在 一 元 表达 式 的 前 面 添加 运算 符 
++ 或 …* 后 得 到 的 表达 式 是 一 个 一 元 表达 式 。 操 作 数 将 被 


加 1(++) 或 减 1(…)， 表 达 式 的 值 是 经 过 加 1、 减 1 以 后 的 值 。 操 作 数 必 
须 是 一 个 左 值 。 


有 关 操 作 数 的 限制 和 运算 细节 的 详细 信息 ， 参 见 加 法 类 运算 符 (参见 
A.7.7 节 ) 和 赋值 类 运算 


符 ( 参 见 A.7.17 节 )。 其 结 末 不 是 左 值 。 


2 地 址 运算 符 一 元 运算 符 & 用 于 取 操 作 数 的 地 址 。 该 操作 数 必须 是 一 个 
左 值 (不 指 回 位 字段 、 不 指 辐 声 


HHN register 类 型 的 对 象 )， 或 者 为 函数 类 型 。 结 果 值 是 一 个 指针 ， 指 辐 
左 值 指 问 的 对 象 或 


函数 。 如 宋 操 作 数 的 类 型 为 T， 则 结果 的 类 型 为 指 癌 工 类 型 的 指针 。 
3 间接 寻 址 运算 符 一 元 运算 符 * 表 示 间 接 寻 址 ， 它 返回 其 操作 数 指向 的 




















对 象 或 函数 。 如 果 它 的 操作 数 是 一 个 

指针 且 指 向 的 对 象 是 算术 、 结 构 、 联 合 或 指针 类 型 ， 则 它 是 一 个 左 值 。 
如 果 表 达 式 的 类 型 为 

"指向 工 类 型 的 指针 "， 则 结果 类 型 为 工 。 

4 一 元 加 运算 符 一 元 运算 符 + 的 操作 数 必须 是 算术 类 型 ， 其 结果 是 操作 
数 的 值 。 如 果 操 作 数 是 整 型 ， 则 将 

进行 整 型 提升 ， 结 果 类 型 是 经 过 提升 后 的 操作 数 的 类 型 。 

说 明 : 一 元 运算 从 + 是 ANSI 标准 新 增加 的 ， 增 加 该 运算 符 是 为 了 与 一 元 
运算 符 . 对 应 。 5 一 元 减 运 算 符 一 元 运算 符 * 的 操作 数 必须 是 算术 类 型 ， 
结果 为 操作 数 的 负 值 。 如 果 操 作 数 是 整 型 ， 则 将 


进行 整 型 提升 。 带 符号 数 的 负 值 的 计算 方法 为 :将 提升 后 得 到 的 类 型 能 
够 表示 的 最 大 值 减 去 


提升 后 的 操作 数 的 值 ， 然 后 加 1; 但 0 的 负 值 仍 为 0。 结 果 类 型 为 提升 后 
的 操作 数 的 类 型 。 


6 二 进 制 反 码 运算 符 一 元 运算 符 ~ 的 操作 数 必须 是 整 型 ， 结 果 为 操作 数 
的 二 进 制 反 码 。 在 运算 过 程 中 需要 对 操 


作 数 进行 整 型 提升 。 如 果 操 作 数 为 无 符号 类 型 ， 则 结果 为 提升 后 的 类 型 
能 够 表示 的 最 大 值 减 


去 操作 数 的 值 而 得 到 的 结 末 值 。 如 果 操 作 数 为 市 符号 类 型 ， 则 结果 的 计 
算 方 式 为 :将 提升 后 的 操作 数 转换 为 相应 的 无 符号 类 型 ， 使 用 运算 符 ~ 计 
和 
JR Y 





7 逻辑 非 运算 符 

运算 符 ! 的 操作 数 必须 是 算术 类 型 或 者 指针 。 如 果 操 作 数 等 于 0， 则 结果 
为 1， 人 否则 结果 为 0。 结 果 类 型 为 int。 

8 sizeof 运算 符 

sizeof 运算 符 计 算 存 储 与 其 操作 数 同类 型 的 对 象 所 需 的 字 节 数 。 操 作 数 
可 以 为 一 个 未 求 值 的 表达 式 ， 也 可 以 为 一 个 用 括号 括 起 来 的 类 型 名 。 
将 sizeof 应 用 于 char 类 型 时 ， 其 结 果 值 为 1 将 它 应 用 于 数组 时 ， 其 值 
为 数组 中 字 节 的 总 数 。 应 用 于 结构 或 联合 时 ， 结 果 为 对 象 的 字 节 数 ， 
包括 对 象 中 包含 的 数组 所 需要 的 任何 填充 空间 :有 mn 个 元 素 的 数组 的 长 
度 是 一 个 数组 元 素 长 度 的 n 倍 。 此 运算 符 不 能 用 于 函数 类 型 和 不 完整 
类 型 的 操作 数 ， 也 不 能 用 于 位 字 段 。 结 果 是 一 个 无 从 号 整 型 常量 ， 具 
体 的 类 型 由 实现 定义 。 在 标准 头 文件 <stddef.h>( 参 见 附录 B) 中 ， 这 一 类 
型 被 定义 为 size_t 类 型 。 

A.7.5 强制 类 型 转换 


以 括号 括 起 来 的 类 型 名 开头 的 一 元 表达 式 将 导致 表达 式 的 值 被 转换 为 指 
定 的 类 型 。 


强制 类 型 转换 表达 式 : 一 元 表达 式 (类 型 名 ) 强 制 类 型 转换 表达 式 


这 种 结构 称 为 强制 类 型 转换 。 类 型 名 将 在 A.8.8 节 描 述 。 转 换 的 结果 已 
在 A.6 市 讨论 过 。 包 含 强制 类 型 转换 的 表达 式 不 是 左 值 。 


A.7.6 乘法 类 运算 符 

乘法 类 运算 符 &、/ 和 % 遵 循 从 左 到 右 的 结合 性 。 

来 法 类 表达 式 : 强制 类 型 转换 表达 式 

来 法 类 表达 式 * 强 制 类 型 转换 表达 式 来 法 类 表达 式 /强制 类 型 转换 表达 式 
来 法 类 表达 式 % 强 制 类 型 转换 表达 式 


运算 符 * 和 /的 操作 数 必须 为 算术 类 型 ， 运 算 符 & 的 操作 数 必 须 为 整 型 。 
这 些 操 作 数 需要 进行 普通 的 算术 类 型 转换 ， 结 果 类 型 由 执行 的 转换 决 























定 。 


二 元 运算 符 * 表 示 乘 法 。 二 元 运算 符 / 用 于 计算 第 一 个 操作 数 同 第 二 个 操 
作 数 相 除 所 得 的 商 ， 而 运算 符 % 用 于 计算 


两 个 操作 数 相 除 后 所 得 的 余数 。 如 果 第 二 个 操作 数 为 0， 则 结果 没有 完 
义 。 并 且 ，(a/b)*b+a%b 


等 于 a 永远 成 立 。 如 果 两 个 操作 数 均 为 非 负 ， 则 余数 为 非 负 值 且 小 于 除 
数 ， 否 则 ， 仅 保证 余 


数 的 绝对 值 小 于 除数 的 绝对 值 。 











ATI 加 法 类 运算 符 


加 法 类 运算 符 + 和 ,遵循 从 左 到 右 的 结合 性 。 如 果 操 作 数 中 有 算术 类 型 的 
E gig ager were sateen 





加 法 类 表达 式 : 来 法 类 表达 式 
加 法 类 表达 式 + 来 法 类 表达 式 加 法 类 表达 陈 * 来 法 类 表达 式 


运算 符 + 用 于 计算 两 个 操作 数 的 和 。 指 向 数组 中 某 个 对 象 的 指针 可 以 和 
一 个 任何 整 型 的 值 相 加 ， 后 者 将 通过 乘 以 所 指 对 象 的 长 度 被 转换 为 地 
址 偏 移 量 。 相 加 得 到 的 和 是 一 个 指针 ， 它 与 初始 指针 具有 相同 的 类 
型 ， 并 指 癌 同一 数组 中 的 妨 一 个 对 象 ， 此 对 象 与 初始 对 象 之 间 有 具有 一 
定 的 偏 移 量 。 因 此 ， 如 果 P 是 一 个 指 回 数 组 中 茶 个 对 象 的 指针 ， 则 表达 
式 P+1 是 指向 数组 中 下 一 个 对 象 的 指针 。 如 果 相 加 所 得 的 和 对 应 的 指 
I 
没有 定义 。 


说 明 : 允 许 指针 指向 数 纽 末尾 元 系 的 下 一 个 元 素 是 ANSI 中 新 增加 的 特 
征 ， 它 使 得 我 们 可 以 按照 通常 的 习惯 循环 地 访问 数 纽 元 素 。 


运算 符 , 用 于 计算 两 个 操作 数 的 差 值 。 可 以 从 某 个 指针 上 减 去 一 个 任何 
整 型 的 值 ， 减 法 运 算 的 转换 规则 和 条 件 与 加 法 的 相同 。 


如 末 指 向 同一 类 型 的 两 个 指针 相 减 ， 则 结果 是 一 个 带 符 写 整 型 数 ， 表 示 
它们 指向 的 对 象 之 间 的 偏 移 量 。 相 令 对 象 间 的 仿 移 量 为 1。 结果 的 类 型 
同 具 体 的 实现 有 关 ， 但 在 标准 头 文件 


<stddef.h> 中 定义 为 ptrdiff t。 只 有 当 指 针 指 辐 的 对 象 属于 同一 数组 时 ， 
差 值 才 有 意义 。 但是， 如 果 P 指向 数组 的 最 后 一 个 元 素 ， 则 (P+1)*P 的 
值 为 1。 

A.7.8 移 位 运算 符 

移 位 运算 符 << 和 >> 遵 循 从 左 到 右 的 结合 性 。 每 个 运算 符 的 各 操作 数 都 


必须 为 整 型 ， 并 且 如 循 整 型 提升 原则 。 结 果 的 类 型 是 提升 后 的 左 操作 
数 的 类 型 。 如 果 右 操作 数 为 负 值 ， 或 者 大 于 或 等 于 左 操作 数 类 型 的 位 



































数 ， 则 结果 没有 定义 。 

移 位 表达 式 : 

加 法 类 表达 式 移 位 表达 式 << 加 法 类 表达 式 移 位 表达 式 >> 加 法 类 表达 式 
E1<<E2 的 值 为 E1( 按 位 模式 解释 ) 同 左 移 E2 位 得 到 的 结果 。 如 果 不 发 
生 洪 出 ， 这 个 结果 值 等 价 于 El 乘 以 2"*。E1>>E2 的 值 为 El 向 右 移 E2 
位 得 到 的 结果 。 如 果 EL 为 无 符号 数 或 为 非 负 值 ， 则 右 移 等 同 于 了 1 除 
以 22。 其 它 情 况 下 的 执行 结果 由 具体 实现 定义 。 

A.7.9 关系 运算 符 


关系 运算 符 遵循 从 左 到 右 的 结合 性 ， 但 这 个 规则 没有 什么 作用 。a<b<c 
在 语法 分 析 时 将 








被 解释 为 (a<b)<c， 并 且 a<b 的 结果 值 只 能 为 0 或 1。 
关系 表达 式 : 


移 位 表达 式 关系 表达 式 < 移 位 表达 式 关系 表达 式 > 移 位 表达 式 关系 表达 
式 <= 移 位 表达 式 关系 表达 式 >= 移 位 表达 式 


当 关 系 表达 式 的 结果 为 假 时 ， 运 算 符 <( 小 于 )、>( 大 于 )、<=( 小 于 等 于 ) 

和 >=( 大 于 等 于 ) 的 结果 值 都 为 0; 当 关系 表达 式 的 结果 为 真 时 ， 它 们 的 结 
果 值 都 为 1。 结 果 的 类 型 为 int RAY. 如 果 操作 数 为 算术 类 型 ， 则 要 进 
行 普通 的 算术 类 型 转换 。 可 以 对 指向 同一 类 型 的 对 象 的 指针 进行 比较 

(忽略 任何 限定 符 )， 其 结果 依赖 于 所 指 对 象 在 地 址 空间 中 的 相对 位 置 。 

指针 比较 只 对 相同 对 象 才 有 意义 :如 果 两 个 指针 指向 同一 个 简单 对 象 ， 

则 相等 ;如 果 指 针 指 癌 同 一 个 结 构 的 不 同 成 员 ， 则 指向 结 构 中 后 声明 的 
成 员 的 指针 较 大 ;如 果 指 针 指向 同一 个 联合 的 不 同 成 员 ， 则 相等 ;如 果 指 
针 指向 一 个 数组 的 不 同 成 员 ， 则 它们 之 间 的 比较 等 价 于 对 应 下 标 之 间 的 
比较 。 如 果 指 针 P 指 同 数组 的 最 后 一 个 成 员 ， 尽 管 P+1 已 指向 数组 的 界 
外 ,但 P+1 仍 比 P 大 。 其 它 情 况 下 指针 的 比较 没有 定义 。 


说 明 : 这 些 规则 允许 指向 同一 个 结构 或 联合 的 不 同 成 员 的 指针 之 间 进 行 
比较 ， 与 第 1 版 比较 起 来 放宽 了 一 些 限制 。 这 些 规则 还 使 得 与 超出 数 
纽 末尾 的 第 一 个 指针 进行 比较 合法 化 。 

A.7.10 相等 类 运算 符 

相等 类 表达 式 : 关系 表达 式 

相等 类 表达 式 == 关 系 表达 式 相等 类 表达 式 != 关 系 表达 式 

运算 符 ==( 等 于 ) 和 !=( 不 等 于 ) 与 关系 运算 符 相 似 ， 但 它们 的 优先 级 更 


低 。( 只 要 a<b 


与 c<d 具有 相同 的 真 值 ， 则 a<b==c<d 的 值 总 为 1。) 


相等 类 运算 符 与 关系 运算 符 具 有 相同 的 规则 ， 但 这 类 运算 符 还 允许 执行 
下 列 比 较 : 指 针 可 以 与 值 为 0 的 稼 量 整 型 表达 式 或 指 同 void 的 指针 进行 
比较 。 参 见 A.6.6 节 。 





















































A.7.11 按 位 与 运算 符 
按 位 与 表达 式 : 相等 类 表达 式 
按 位 与 表达 式 & 相 等 类 表达 式 


执行 按 位 与 运算 时 要 进行 普通 的 算术 类 型 转换 。 结 果 为 操作 数 经 按 位 与 
运算 后 得 到 的 值 。 该 运算 符 仪 适用 于 整 型 操作 数 。 





A.7.12 按 位 异 或 运算 符 
按 位 寞 或 表达 式 : 按 位 与 表达 式 
按 位 异 或 表达 式 ^ 按 位 与 表达 式 


执行 按 位 寞 或 运算 时 要 进行 普通 的 算术 类 型 转换 ， 结 果 为 操作 数 经 按 位 
异 或 运算 后 得 到 的 值 。 该 运算 符 仅 适用 于 整 型 操作 数 。 


A.7.13 按 位 或 运算 符 
按 位 或 表达 式 : 按 位 异 或 表达 式 
按 位 或 表达 式 | 按 位 异 或 表达 式 


执行 按 位 或 运算 时 要 进行 常规 的 算术 类 型 转换 ， 结 果 为 操作 数 经 按 位 或 
运算 后 得 到 的 值 。 该 运算 符 仅 适用 于 整 型 操作 数 。 

A.7.14 逻辑 与 运算 符 

逻辑 与 表达 式 : 按 位 或 表达 式 

逻辑 与 表达 式 &&& 按 位 或 表达 式 

运算 符 && 遵 循 从 左 到 右 的 结合 性 。 如 果 两 个 操作 数 都 不 等 于 0， 则 结 

果 值 为 1， 否 则 结果 值 0。 与 运算 符 & 不 同 的 是 ，&& 确 保 从 左 到 右 的 求 
值 次 序 :首先 计算 第 一 个 操作 数 ， 包 括 所 有 可 能 的 副作用 ;如 果 为 0， 则 

整个 表达 式 的 值 为 0; 否 则 ， 计 算 右 操作 数 ， 如 果 为 0， 则 整个 表达 式 的 
值 为 0， 否 则 为 1。 


两 个 操作 数 不 需 要 为 同一 类 型 ， 但 是 ， 每 个 操作 数 必须 为 算术 类 型 或 者 
Hil. AGRA 


int 类 型 。 























A.7.15 逻辑 或 运算 符 


逻辑 或 表达 式 : 逻辑 与 表达 式 


逻辑 或 表达 式 || 馆 辑 与 表达 式 


运算 符 || 巡 循 从 左 到 右 的 结合 性 。 如 果 该 运算 符 的 某 个 操作 数 不 为 0， 则 
REN 1; 人 否则 结 RA 0。 与 运算 符 | 不 同 的 是 ，|| 硝 保 从 左 到 右 的 求 
值 次 序 :首先 计算 第 一 个 操作 数 ， 包 括 所 有 可 能 的 副作用 ;如 果 不 为 0， 
则 整个 表达 式 的 值 为 1; 否则， 计算 右 操 作 数 ， 如 果 不 为 0， 则 整个 表达 
AWEN 1; 否 则 结果 为 0。 


两 个 操作 数 不 需 要 为 同一 类 型 ， 但 是 每 个 操作 数 必须 为 算术 类 型 或 者 指 
针 。 其 结果 为 int 














类 型 。 

A.7.16 条 件 运算 符 

条 件 表达 式 : 

逻辑 或 表达 式 逻辑 或 表达 式 ? 表 达 式 :条 件 表达 式 

首先 计算 第 一 个 表达 式 (包括 所 有 可 能 的 副作用 )， 如 果 该 表达 式 的 值 不 
等 于 0， 则 结果 为 第 二 个 表达 式 的 值 ， 否 则 结果 为 第 三 个 表达 式 的 值 。 
第 二 个 和 第 三 个 操作 数 中 仅 有 一 个 操作 数 会 被 计算 。 如 果 第 二 个 和 第 
三 个 操作 数 为 算术 类 型 ， 则 要 进行 普通 的 算术 类 型 转换 ， 以 使 它 们 的 
类 型 相同 ， 该 类 型 也 是 结果 的 类 型 。 如 果 它 们 都 是 void 类 型 ， 或 者 是 
同一 类 型 的 结构 或 联合 ， 或 者 是 指向 同一 类 型 的 对 象 的 指针 ， 则 结果 
的 类 型 与 这 两 个 操作 数 的 类 型 相同 。 如 果 其 中 一 个 操作 数 是 指针 ， 而 
另 一 个 是 常量 0， 则 0 将 被 转换 为 指针 类 型 ， 且 结果 为 指针 类 型 。 如 果 
一 个 操作 数 为 指向 void 的 指针 ， 而 另 一 个 操作 数 为 指向 其 它 类 型 的 指 
针 ， 则 指向 其 它 类 型 的 指针 将 被 转换 为 指 癌 void 的 指针 ， 这 也 是 结果 
的 类 型 。 

在 比较 指针 的 类 型 时 ， 指 针 所 指 对 象 的 类 型 的 任何 类 型 限定 符 (参见 
A.8.2 节 ) 都 将 被 忽略 ， 但 结果 类 型 会 继承 条 件 的 各 分 支 的 限定 符 。 


A.7.17 赋值 表达 式 

赋值 运算 符 有 多 个 ， 它 们 都 是 从 左 到 右 结合 。 

赋值 表达 式 : 

条 件 表达 式 

一 元 表达 式 赋值 运算 符 赋值 表达 式 赋值 运算 符 :one of 
= 

所 有 这 些 运 算 符 都 要 求 左 操作 数 为 左 值 ， 且 该 左 值 是 可 以 修改 的 : 它 不 


可 以 是 数组 、 不 完整 类 型 或 函数 。 同 时 其 类 型 不 能 包括 const 限定 符 ;如 
果 它 是 结构 或 联合 ， 则 它 的 任意 一 个 成 员 或 递归 子 成 员 不 能 包括 const 






































限定 符 。 赋 值 表 达 式 的 类 型 是 其 左 操 作 数 的 类 型 ， 值 是 赋值 操作 执行 
后 存储 在 大 操作 数 中 的 值 。 


在 使 用 运算 符 = 的 简单 赋值 中 ， 表 达 式 的 值 将 蔡 换 左 值 所 指 癌 的 对 象 的 
值 。 下 面 几 个 条 件 中 必须 有 一 个 条 件 成 立 : 两 个 操作 数 均 为 算术 类 型 ， 
在 此 情况 下 右 操 作 数 的 类 型 通过 赋值 转 换 为 左 操作 数 的 类 型 ;两 个 操作 
数 为 同一 类 型 的 结构 或 联合 ;一 个 操作 数 是 指针 ， 另 一 个 操 PERCE TE IA 
void 的 指针 ; 左 操作 数 是 指针 ， 右 操作 数 是 值 为 0 的 常量 表达 式 ;两 个 操 
作 数 都 是 指向 同一 类 型 的 函数 或 对 象 的 指针 ， 但 右 操 作 数 可 以 没有 
const 或 volatile 限定 符 。 


形式 为 E1 op= E2 的 表达 式 等 价 于 E1 = El op (E2)， 惟 一 的 区 别 是 前 者 
对 EL1 仅 求 值 一 次 。 








表达 式 : 

赋值 表达 式 

表达 式 , 赋值 表达 式 

由 逗 写 分 隐 的 两 个 表达 式 的 求 值 次 序 为 从 左 到 右 ， 并 且 左 表达 式 的 值 被 
丢弃 。 右 操作 数 的 类 型 和 值 就 是 结果 的 类 型 和 值 。 在 开始 计算 右 操作 

数 以 前 ， 将 完成 左 操作 数 涉 及 到 的 副作用 的 计算 。 在 逗号 有 特别 含义 
的 上 下 文中 ， 如 在 函数 参数 表 ( 参 见 A.7.3 节 ) 和 初 值 列表 (A.8.7 节 ) 中 ， 

再 要 使 用 赋值 表达 式 作 为 语法 单元 ， 这 样 ， 运 号 运算 符 仅 出 现在 圆 括号 
中 。 例 如 ， 下列 函数 调用 : 


f(a, (t=3, t+2), c) 

AG 3 个 参数 ， 其 中 第 二 个 参数 的 值 为 5。 

A.7.19 常量 表达 式 

从 语法 上 看 ， 常 量 表达 式 是 限定 于 运算 符 的 某 一 个 子 集 的 表达 式 : 
常量 表达 式 : 

条 件 表达 式 

某 些 上 下 文 要 求 表 达 式 的 值 为 常量 ， 例 如 ，switch 语句 中 case 后 面 的 数 
值 、 数 组 边界 和 位 字段 的 长 度 、 枚 举 和 常量 的 值 、 初 值 以 及 某 些 预 处 理 
AKIA 

除了 作为 sizeof 的 操作 数 之 外 ， 常 量 表达 式 中 可 以 不 包含 赋值 、 自 增 或 
目 减 运算 符 、 函数 调用 或 人 逗号 运算 从 。 如 果 要 求 常 量 表达 式 为 整 型 ， 
则 它 的 操作 数 必 须 由 整 型 、 枚 举 、 字 符 和 浮 点 常量 组 成 ;强制 类 型 转换 
必须 指定 为 整 型 ， 任 何 浮 点 常量 都 将 被 强制 转换 为 整 型 。 此 规则 对 数 


组 、 间 接 访 问 、 取 地 址 运算 符 和 结构 成 员 操 作 不 适用 。( 但 是 ，sizeof 可 
DAE 何 类 型 的 操作 数 。) 




















初 值 中 的 常量 表达 式 允 许 更 大 的 范围 :操作 数 可 以 是 任意 类 型 的 常量 ， 

一 元 运算 符 && 可 以 作用 于 外 部 、 议 态 对 象 以 及 以 第 量 表达 式 为 下 标的 外 
部 或 静态 数组 。 对 于 无 下 标的 数组 或 浮 数 的 情况 ， 一 元 运算 符 & 将 被 隐 
式 地 应 用 。 初 值 计算 的 结果 值 必须 为 下 列 二 者 之 一 :一 个 常量 ; 前 面 声明 
的 外 部 或 静态 对 象 的 地 址 加 上 或 减 去 一 个 常量 。 


允许 出 现在 #f 后 面 的 整 型 常量 表达 式 的 范围 较 小 ， 它 不 允许 sizeof K 
达 式 、 枚 举 常 量 和 强制 类 型 转换 。 详 细 信 息 参 见 A.12.5 节 。 
A.8 声明 


声明 (declaration) 用 于 说 明 每 个 标识 得 的 含义 ， 而 并 不 需要 为 每 个 标识 符 
预 留存 储 空间 。 预 留存 储 空间 的 声明 称 为 定义 (definition)。 声 明 的 形式 
如 下 : 











声明 


声明 说 明 符 初始 化 声明 符 表 opt; 


初始 化 声明 符 表 中 的 声明 符 包 含 被 声明 的 标识 符 ; 声 明说 明 符 由 一 系列 
的 类 型 和 存储 类 说 明 符 组 成 。 


声明 说 明 符 : 


存储 类 说 明 符 声明 说 明 符 opt 类 型 说 明 符 声明 说 明 符 opt 类 型 限定 符 
WW >> Fete 
声明 说 明 符 opt 


初 姑 化 声明 符 表 : 初始 化 声明 符 

初 寻 化 声明 符 爱 ， 初 始 化 声明 符 初始 化 声明 符 : 

声明 符 

声明 符 = 初 值 

声明 符 将 在 稍 后 部 分 讨论 (参见 A.8.5 节 )。 声 明 符 包含 了 被 声明 的 名 
字 。 一 个 声明 中 必须 至 少 包含 一 个 声明 符 ， 或 者 其 类 型 说 明 符 必须 声 
明 一 个 结构 标记 、 一 个 联合 标记 或 枚 举 的 成 员 。 不 允许 空 声明 。 
A.8.1 存储 类 说 明 符 


存储 类 说 明 符 如 下 所 示 : 存储 类 说 明 符 : 





auto register static extern typedef 
有 关 存 储 类 的 意义 ， 我 们 已 在 A.4 节 中 讨论 过 。 


说 明 符 auto 和 register 将 声明 的 对 象 说 明 为 目 动 存储 类 对 象 ， 这 些 对 象 
仅 可 用 在 函 数 中 。 这 种 声明 也 具有 定义 的 作用 ， 并 将 预 留存 储 空间 。 

iH register 说 明 符 的 声明 等 价 于 带 有 auto 说 明 符 的 声明 ， 所 不 同 的 

是 ， 前 者 上 暗示 了 声明 的 对 象 将 被 频 蚂 地 访问 。 只 有 很 少 的 对 象 被 真正 
存放 在 寄存 器 中 ， 并 且 只 有 特定 类 型 才 可 以 。 该 限制 同 具体 的 实现 有 

关 。 但 是 ， 如 果 一 个 对 象 被 声明 为 register， 则 将 不 能 对 它 应 用 一 元 运 
算 符 &( 显 式 应 用 或 隐 式 应 用 部 不 允许 )。 

















说 明 : 对 声明 为 register 但 实际 按照 auto 类 型 处 理 的 对 象 的 地 址 进行 计算 
是 非法 的 。 这 是 一 个 新 增加 的 规则 。 


说 明 符 static 将 声明 的 对 象 说 明 为 静态 存储 类 。 这 种 对 象 可 以 用 在 函数 
内 部 或 函数 外 部 。 在 函数 内 部 ， 该 说 明 符 将 引起 存储 空间 的 分 配 ， 具 
有 定义 的 作用 。 有 关 该 说 明 符 在 函数 外 部 的 作用 参见 A.11.2 节 。 


PABA HIE) extern 声明 表明 ， 被 声明 的 对 象 的 存储 空间 定义 在 其 它 地 
方 。 有 关 该 说 明 符 在 函数 外 部 的 作用 参见 A.11.2 W. 

typedef 说 明 符 并 不 会 为 对 象 预 留存 储 空 间 。 之 所 以 将 它 称 为 存储 类 说 
WAT, eA Se 法 描述 上 的 方便 。 我 们 将 在 A.8.9 THE 

一 个 声明 中 最 多 只 能 有 一 个 存储 类 说 明 符 。 如 果 没 有 指定 存储 类 说 明 
符 ， 则 将 按照 下 列 规则 进行 :在 函数 内 部 声明 的 对 象 被 认为 是 auto 类 型 ; 
在 函数 内 部 声明 的 函数 被 认为 是 extern 类 型 ;在 函数 外 部 声明 的 对 象 与 
函数 将 被 认为 是 static 类 型 ， 且 具有 外 部 连接 。 详 细 信 息 参 见 A.10 市 
和 A.11 市 。 


A.8.2 类 型 说 明 符 


类 型 说 明 符 的 定义 如 下 : 类 型 说 明 符 : 























void char short int long float double signed 


unsigned 
结构 或 联合 说 明 符 枚 举 说 明 符 类 型 定义 名 


其 中 ，long 和 short 这 两 个 类 型 说 明 符 中 最 多 有 一 个 可 同时 与 int 一 起 使 
用 ， 并 且 ， 在 这 种 情况 下 省 略 关 键 字 int 的 含义 也 是 一 样 的 。long 可 与 
double 一 起 使 用 。signed 和 unsigned 这 两 个 类 型 说 明 符 中 最 多 有 一 个 可 
同时 与 int. int 的 short 2% long 形式 、char 一 起 使 用 。signed 和 unsigned 
可 以 单独 使 用 ， 这 种 情况 下 默认 为 int KA. signed 说 明 符 对 于 强制 
char 对 象 带 符号 位 是 非常 有 用 的 ;其 它 整 型 也 允许 之 signed 声明 ， 但 这 
FE 








多 余 的 。 


除了 上 和 面 这 些 情况 之 外 ， 在 一 个 声明 中 最 多 只 能 使 用 一 个 类 型 说 明 符 。 
如 琳 声 明 中 没有 类 型 说 明 符 ， 则 默认 为 int 类 型 。 


天 型 也 可 以 用 限定 符 限 蹲 ， 以 指定 被 声明 对 象 的 特殊 属性 。 类 型 限定 


付 : 
const volatile 


类 型 限定 符 可 与 任何 类 型 说 明 符 一 起 使 用 。 可 以 对 const 对 象 进行 初始 
化 ， 但 在 初始 化 


以 后 不 能 进行 赋值 。volatile 对 象 没 有 与 实现 无 关 的 语义 。 

说 明 :const 和 volatile 属性 是 ANSI 标准 新 增加 的 特性 。const 用 于 声明 
可 以 存放 在 只 读 存 储 器 中 的 对 象 ， 并 可 能 提高 优化 的 可 能 性 。volatile 
FAP aii till SS SR BL BF i AT fe 的 优化 。 倒 如 ， 对 于 具有 内 存 映 像 输入 / 输 
出 的 机 器 ， 指 问 设 备 寄 存 器 的 指针 可 以 声明 为 指 向 volatile 的 指针 ， 目 
的 是 防止 编译 器 通过 指针 删除 明显 多 余 的 引用 。 除 了 诊断 显 式 尝 试 修 
改 const 对 象 的 情况 外 ， 编 译 器 可 能 会 忽略 这 些 限定 符 。 

A.8.3 结构 和 联合 声明 

结构 是 由 不 同类 型 的 命名 成 员 序 列 组 成 的 对 象 。 联 合 也 是 对 象 ， 在 不 同 
NZ), CHGS 个 不 同类 型 成 员 中 的 任意 一 个 成 员 。 结 构 和 联合 说 明 
符 具 有 相同 的 形式 。 

结构 或 联合 说 明 符 : 

结构 或 联合 标识 符 opt {结构 声明 表 } 

结构 或 联合 标识 符 


结构 或 联合 : 














struct union 





结构 声明 表 是 对 结构 或 联合 的 成 员 进 行 声 明 的 声明 序列 : 
结构 声明 表 

结构 声明 

结构 声明 表 结构 声明 结构 声明 : 

说 明 符 限 定 符 表 结构 声明 符 表 说 明 符 限定 符 表 : 


类 型 说 明 符 说 明 符 限定 符 表 opt 

类 型 限定 符 说 明 符 限定 符 表 opt 

结构 声明 符 表 : 结构 声明 符 

结构 声明 符 表 , 结构 声明 符 通常 ， 结 构 声 明 符 就 是 结构 或 联合 成 员 的 声 
明 符 。 结 构成 员 也 可 能 由 指定 数目 的 比特 位 组 成 ， 

这 种 成 员 称 为 位 字段 ， 或 仅 称 为 字段 ， 其 长 度 由 跟 在 声明 符 冒 号 之 后 的 
常量 表达 式 指定 。 

结构 声明 符 : 

声明 符 


声明 符 opt: 常量 表达 式 下 列 形 式 的 类 型 说 明 符 将 其 中 的 标识 符 声明 为 
结构 声明 表 指 定 的 结构 或 联合 的 标记 : 结构 或 联合 标识 符 {结构 声明 表 } 


在 同一 作用 域 或 内 层 作用 域 中 的 后 续 声明 中 ， 可 以 在 说 明 符 中 使 用 标记 
(而 不 使 用 结构 声明 表 ) 来 引用 同一 类 型 ， 如 下 所 示 : 


结构 或 联合 标识 符 如 果 说 明 符 中 只 有 标记 而 无 结构 声明 表 ， 并 且 标 记 
没有 声明 ， 则 认为 真 为 不 完整 类 型 。 具 有 


不 完整 结构 或 联合 类 型 的 对 象 可 在 不 需要 对 象 大 小 的 上 下 文中 引用 ， 比 
如 ， 在 声明 中 (不 是 


定义 中 )， 它 可 用 于 说 明 一 个 指针 或 创建 一 个 typedef 类 型 ， 其 余 情 况 则 
不 允许。 在 引用 之 后 ， 如 果 具 有 该 标记 的 说 明 符 再 次 出 现 并 包含 一 个 
声明 表 ， 则 该 类 型 成 为 完整 类 型 。 即 使 是 在 包含 结构 声明 表 的 说 明 符 
中 ， 在 该 结构 声明 表 内 声明 的 结构 或 联合 类 型 也 是 不 完整 的 ， 一 直到 
化 括号 ” } "终止 该 说 明 符 时 ， 声 明 的 类 型 才 成 为 完整 类 型 。 


结构 中 不 能 包含 不 完整 类 型 的 成 员 。 因 此 ， 不 能 声明 包含 自身 实例 的 结 
构 或 联合 。 但 是 ， 除了 可 以 命名 结构 或 联合 类 型 外 ， 标 记 还 可 以 用 来 
定义 目 引 用 结构 。 由 于 可 以 声明 指向 不 完 整 类 型 的 指针 ， 所 以 ， 结 构 
或 联合 可 包含 指 癌 目 喘 实 例 的 指针 。 



































下 列 形式 的 声明 适用 一 个 非常 特殊 的 规则 : 结构 或 联合 标识 符 ， 


这 种 形式 的 声明 声明 了 一 个 结构 或 联合 ， 但 它 没 有 声明 表 和 声明 符 。 即 
使 该 标识 符 是 外 层 作用 域 中 己 声 明 过 的 结构 标记 或 联合 的 标记 (参见 
A.11.1 节 )， 该 声明 仍 将 使 该 标识 符 成 为 当前 作用 域内 一 个 新 的 不 完整 
类 型 的 结构 标记 或 联合 的 标记 。 


说 明 :这 是 ANSI 中 一 个 新 的 比较 难 理解 的 规则 。 它 旨 在 处 理 内 层 作 用 域 
aren eens 但 这 些 结构 的 标记 可 能 已 在 外 层 作 用 
或 中 声明 。 


共有 结构 声明 表 而 无 标记 的 结构 说 明 符 或 联合 次 明 符 用 于 创建 一 个 惟一 
的 类 型 ， 它 只 能 被 它 所 在 的 声明 直接 引用 。 

成 员 和 标记 的 名 字 不 会 相互 冲突 ， 也 不 会 与 普通 变量 冲突 。 一 个 成 员 名 
字 不 能 在 同一 结 























构 或 联合 中 出 现 两 次 ， 但 相同 的 成 员 名 字 可 用 在 不 同 的 结构 或 联合 中 。 


说 明 : 在 本 书 的 第 工 版 中 ， 结 构 或 联合 的 成 员 名 与 其 父 幸 无 关联 。 但 
xe» TE ANSI 标准 制定 前 ， 这 种 关联 在 编译 器 中 普遍 存在 。 


除 字段 类 型 的 成 员外 ， 结 构成 员 或 联合 成 员 可 以 为 任意 对 象 类 型 。 字 段 
成 员 ( 它 不 需要 声明 符 ， 因 此 可 以 不 命名 ) 的 类 型 为 int、unsigned int 或 
signed int， 并 被 解释 为 指 定 长 度 (用 二 进 制 位 表示 ) 的 整 型 对 象 ，int 类 型 
的 字段 是 否 看 作为 有 符号 数 同 具体 的 实现 有 关 。 结 构 的 相 邻 字段 成 员 
以 某 种 力 式 ( 同 具体 的 实现 有 关 ) 存 放 在 某 些 存储 单元 中 ( 同 具 体 的 实现 
有 关 )。 如 果 某 字段 之 后 的 男 一 字段 无 法 全 部 存 入 已 被 前 面 的 字段 部 分 
占用 的 存储 单 元 中 ， 则 它 可 能 会 被 分 割 存 放 到 多 个 存储 单元 中 ， 或 者 
是 ， 存 储 单元 中 的 剩余 部 分 也 可 能 被 填充 。 我 们 可 以 用 宽度 为 0 的 无 
站 
i 台 存 储 。 


说 明 : 在 字段 处 理 方面 ，ANSI 标准 比 第 1 版 更 依赖 于 具体 的 实现 。 如 果 
要 按照 与 实现 相 关 的 方式 存储 字段 ， 建 议 阅读 一 下 该 语言 规则 。 作 为 
一 种 可 移植 的 方法 ， 带 字段 的 结构 可 用 来 节省 存储 空间 (代价 是 增加 了 
指令 空间 和 访问 字段 的 时 间 )， 同 时 ， 它 还 可 以 用 来 在 位 层次 上 描述 存 
和 
纲 则 。 


结构 成 员 的 地 址 值 按 它们 声明 的 顺序 递增 。 非 学 段 类 型 的 结构 成 员 根 据 
其 类 型 在 地 址 边 界 上 对 齐 ， 因 此 ， 在 结构 中 可 能 存在 无 名 空 穴 。 若 指 
回 菜 一 结构 的 指针 被 强制 转换 为 指 同 该 结构 第 一 个 成 员 的 指针 类 型 ， 
则 结果 将 指 回 该 结构 的 第 一 个 成 员 。 


联合 可 以 被 看 作为 结构 ， 其 所 有 成 员 起 始 偏 移 量 都 为 0， 并 且 其 大 小 足 
以 容纳 任何 成 员 。 任 一 时 刻 它 最 多 只 能 存储 其 中 的 一 个 成 员 。 如 果 指 
PIA Re AR AY SRE ILA PE MOB 
向 该 成 员 。 


如 下 所 示 是 结构 声明 的 一 个 简单 例子 : 
































struct tnode { char tword[20]; int count; 


struct tnode *left; struct tnode *right; 
} 


该 结构 包含 一 个 具有 20 个 字符 的 数组 、 一 个 整数 以 及 两 个 指向 类 似 结 
构 的 指针 。 在 给 出 这 样 的 声明 后 ， 下 列 说 明 : 


struct tnode s, *sp; 


将 把 s 声明 为 给 定 类 型 的 结构 ， 把 sp 声明 为 指 网 给 定 类 型 的 结构 的 指 
针 。 在 这 些 声明 的 基础 上 ， 表 达 式 


Sp。>Count 


引用 sp 指 癌 的 结构 的 count 字段 ， 而 


s. left 
则 引用 结构 的 左 子 树 指 针 ， 表 达 式 
s.righte>tword[0] 


引用 s 右 子 树 中 tword 成 员 的 第 一 个 字符 。 HTL, RITARA 
联合 的 茶 一 成 员 ， 除 非 已 用 该 成 员 给 联合 赋值 。 但 是 ， 有 一 


个 特殊 的 情况 可 以 简化 联合 的 使 用 :如 果 一 个 联合 包含 共享 一 个 公共 初 
始 序 列 的 多 个 结构 ， 


并 且 该 联合 当前 包含 这 些 结构 中 的 茶 一 个 ， 则 允许 引用 这 些 结构 中 任 一 
结构 的 公共 初始 部 分 。 例如 ， 下 面 这 段 程序 是 合法 的 : 














union { 

struct { 

int type; 

} n; struct { 

int type; int intnode; 
} ni; struct { 

int type; 

float floatnode; 

} nf; 


} u; 


u.nf.type = FLOAT; u.nf.floatnode = 3.14; 


if (un.type == FLOAT) 

... sin(u.nf.floatnode) ... 

A.8.4 枚 举 

枚 举 类 型 是 一 种 特殊 的 类 型 ， 它 的 值 包含 在 一 个 命名 的 常量 集合 中 。 这 


些 常量 称 为 枚 举 符 。 枚 举 说 明 符 的 形式 借鉴 了 结构 说 明 符 和 联合 说 明 
符 的 形式 。 





枚 举 说 明 符 : 

enum 标识 符 opt { 枚 举 符 表 } enum 标识 符 

枚 举 符 表 : 

枚 举 符 

枚 举 符 表 , 枚 举 符 枚 举 符 : 

标识 符 

标识 符 = 常量 表达 式 

枚 举 符 表 中 的 标识 符 声 明 为 int 类 型 的 常量 ， 它 们 可 以 用 在 常量 可 以 出 
现 的 任何 地 方 。 如 果 其 中 不 包括 带 有 = 的 枚 举 符 ， 则 相应 常量 值 从 0 开 
始 ， 且 枚 举 常量 值 从 左 至 右 依次 递增 1。 如 果 其 中 包括 带 有 = 的 枚 举 

人 
次 递增 。 


同一 作用 域 中 的 各 枚 举 符 的 名 字 必 须 互 不 相同 ， 也 不 能 与 普通 变量 名 相 
同 ， 但 其 值 可 以 相同 。 

枚 举 说 明 符 中 标识 符 的 作用 与 结构 说 明 符 中 结构 标记 的 作用 类 似 ， 它 命 
名 了 一 个 特定 的 枚 举 类 型 。 除 了 不 存在 不 完整 枚 举 类 型 之 外 ， 枚 举 说 
明 符 在 有 无 标记 、 有 无 枚 举 符 表 的 情况 下 的 规则 与 结构 或 联合 中 相应 
的 规则 相同 。 无 枚 举 符 表 的 枚 举 说 明 符 的 标记 必须 指 同 作 用 域 HE 9 
个 具有 枚 举 符 表 的 说 明 符 。 

说 明 :相对 于 本 书 第 1 版 ， 枚 举 类 型 是 一 个 新 概念 ， 但 它 作 为 C 语言 的 
一 部 分 已 有 好 多 年 了 。 


A.8.5 声明 符 
声明 符 的 语法 如 下 所 示 声明 符 : 


指针 opt 直接 声明 符 直接 声明 符 











标识 符 
(声明 符 ) 


直接 声明 符 [常量 表达 式 opt] 直接 声明 符 ( 形 式 参数 类 型 表 ) 直接 声明 符 
(标识 表 opt) 


指针 : 

* 类 型 限定 符 表 opt 

* 类 型 限定 符 表 opt 指针 类 型 限定 符 表 
类 型 限定 符 


类 型 限定 符 表 类 型 限定 符 声明 符 的 结构 与 间接 指针 、 函 数 及 数组 表达 
式 的 结构 类 似 ， 结 合 性 也 相同 。 

A.8.6 声明 符 的 含义 

声明 符 表 出 现在 类 型 说 明 符 和 存储 类 说 明 符 序列 之 后 。 每 个 声明 符 声 明 
一 个 帷 一 的 主 标 识 符 ， 该 标识 符 是 直接 声明 符 产 生 式 的 第 一 个 候选 
式 。 存 储 类 说 明 符 可 直接 作用 于 该 标识 符 ， 但 其 类 型 由 声明 符 的 形式 
决定 。 当 声明 符 的 标识 符 出 现在 与 该 声明 符 形式 相同 的 表达 式 中 时 ， 
该 声明 符 将 被 作为 一 个 断言 ， 其 结果 将 产生 一 个 指定 类 型 的 对 象 。 

如 果 只 考虑 声明 说 明 符 (参见 A.8.2 节 ) 的 类 型 部 分 及 特定 的 声明 符 ， 则 
声明 可 以 表示 为 “ 工 D" 的 形式 ， 其 中 工 代表 类 型 ，D 代表 声明 符 。 在 不 
同形 式 的 声明 中 ， 标 识 符 的 类 型 可 用 这 种 形式 来 表述 。 


在 声明 TD 中 ， 如 果 DD 是 一 个 不 加 任何 限定 的 标识 符 ， 则 该 标识 符 的 
类 型 为 T。 在 声明 TD 中 ， 如 果 DD 的 形式 为 : 


(D1) 


则 D1 中 标识 符 的 类 型 与 D 的 类 型 相同 。 圆 括号 不 改变 类 型 ， 但 可 改变 
复杂 声明 符 之 间 的 结合 。 


1， 指 针 声 明 符 
在 声明 TD 中 ， 如 果 D 具有 下 列 形式 : 
* 类 型 限定 符 表 D1 


且 声 明 工 D1 中 的 标识 得 的 类 型 为 "类 型 修饰 答 T"， 则 DD 中 标识 符 的 类 

















型 为 "类 型 修饰 符 类 型 限定 符 表 指向 工 的 指针 "。 星 号 * 后 的 限定 符 作 用 
于 指针 本 里 ， 而 不 是 作用 于 指针 指向 的 对 象 。 


例如 。 考 虑 下 列 声明 : 

int *ap[]; 

其 中 ，ap[] 的 作用 等 价 于 D1， 声 明 “ int ap[]" 将 把 ap 的 类 型 声明 为 “int 
类 型 的 数组 "， 类 型 限定 符 表 为 空 ， 且 类 型 修饰 符 为 ” .……. 的 数组 "。 
因此 ， 该 声明 实际 上 将 把 ap 声明 为 " 指 向 int 类 型 的 指针 数组 "类 型 。 
我 们 来 看 另外 一 个 例子 。 下 列 声明 : 


int i, *pi, *const cpi = &i; 


const int ci = 3, *pci; 


声明 了 一 个 整 型 i 和 一 个 指向 整 型 的 指针 pi。 不 能 修改 第 量 指针 cpi 的 
值 ， 该 指针 总 是 指向 同一 位 置 ， 但 它 所 指 之 处 的 值 可 以 改变 。 整 型 ci 
古 常 量 ， 也 不 能 修改 (可 以 进行 初始 化 ， 如 本 例 中 所 示 )。pci 的 类 型 

是 " 指 辣 const int 的 指针 "，pci AAA DPE Talal 一 个 地 方 ， 但 
它 所 指 之 处 的 值 不 能 通过 pei 赋值 来 改变 ， 


2 数组 声明 符 
在 声明 TD 中 ， 如 果 D 具有 下 列 形式 : 
DIL EKAA opt] 


HAH T D1 中 标识 符 的 类 型 是 "类 型 修饰 符 T"， 则 DD 的 标识 符 类 型 
为 "类 型 修饰 符 工 类 型 的 数组 "。 如 果 存 在 常量 表达 式 ， 则 该 常量 表达 式 
必须 为 整 型 且 值 大 于 0。 奉 缺少 指定 数组 上 界 的 常量 表达 式 ， 则 该 数组 


类 型 是 不 完整 类 型 。 


数组 可 以 由 算术 类 型 、 指 针 类 型 、 结 构 类 型 或 联合 类 型 构造 而 成 ， 也 可 
以 由 另 一 个 数组 构造 而 成 (生成 多 维 数组 )。 构 造 数 组 的 类 型 必须 是 完整 
类 型 ， 绝 对 不 能 是 不 完整 类 型 的 数组 或 结构 。 也 就 是 说 ， 对 于 多 维 数 
组 来 说 ， 只 有 第 一 维 可 以 缺 省 。 对 于 不 完整 数组 类 型 的 对 象 来 说 ， 其 

类 型 可 以 通过 对 该 对 象 进行 另 一 个 完整 声明 (参见 A.10.2 节 ) 或 初始 化 

(参见 A.8.7 节 ) 来 使 其 完整 。 例 如 : 


float fa[17], *afp[17]; 
声明 了 一 个 浮 点 数 数组 和 一 个 指 回 浮 点 数 的 指针 数组 ， 而 
Static int x3d[3][5][7]; 


则 声明 了 一 个 静态 的 三 维 整 型 数组 ， 其 大 小 为 3x5x7。 具 体 来 说 ，x3d 
是 一 个 由 3 个 页 组 成 的 数组 ， 每 个 页 都 是 由 5 个 数组 组 成 的 一 个 数 
2H, 5 个 数组 中 的 每 个 数组 又 都 是 由 7 个 整 型 数组 成 的 数组 。x3d、 
x3d[i]、x3d[i][j] 与 x3d[ij[j][kj 都 可 以 合法 地 出 现在 一 个 表达 式 中 。 前 三 
者 是 数组 类 型 ， 最 后 一 个 是 int 类 型 。 更 准确 地 说 ，x3d[i]fj] 是 一 个 有 7 
个 整 型 元 素 的 数组 ;x3d[ 则 是 有 5 个 元 素 的 数组 ， 而 其 中 的 每 个 元 素 又 

















古 一 个 具有 7 个 整 型 元 系 的 数组 。 


根据 数组 下 标 运 算 的 定义 ，E1[E2] 等 价 于 *(E1+E2)。 因 此 ， 尽 管 表达 式 
的 形式 看 上 去 不 对 称 ， 但 下 标 运 算是 可 交换 的 运算 。 根 据 适 用 于 运算 
符 + 和 数组 的 转换 规则 (参见 A.6.6 节 、 A.7.1 节 与 A.7.7 节 )， 若 EL ER 
组 日 E2 是 整数 ， 则 E1[E2] 代 表 E1 的 第 E2 个 成 员 。 


在 本 例 中 ，x3d[i][j][k] 等 价 于 *(x3d[i][j]+k)。 第 一 个 子 表达 式 x3d[i][j] 将 
按照 A.7.1 节 中 的 规则 转换 为 “指向 整 型 数组 的 指针 ”类 型 ， 而 根据 A.7.7 
节 中 的 规则 ， 这 里 的 加 法 运算 需要 乘 以 整 型 类 型 的 长 度 。 它 遵循 下 列 
规则 :数组 按 行 存储 (最 后 一 维 下 标 变 动 最 快 )， 且 声明 中 的 第 一 维 下 标 决 
定数 组 所 需 的 存储 区 大 小 ， 但 第 一 维 下 标 在 下 标 计算 时 无 其 它 作用 。 

3 函数 声明 符 

在 新 式 的 函数 声明 TD P, WR DERA FIER: 


D1( 形 式 参 数 类 型 表 ) 


并 且 ， 声 明 TD1 中 标识 符 的 类 型 为 "类 型 修饰 符 T"， 则 DD 的 标识 符 类 
型 是 "返回 T 类 型 值 且 共 有 6 形式 参数 类 型 表 ' 中 的 参数 的 6 类 型 修饰 符 类 
型 的 函数 "。 


形式 参数 的 语法 定义 为 : 形式 参数 类 型 表 : 

形式 参数 表 形式 参数 表 , .… 

形式 参数 表 : 

形式 参数 声明 

形式 参数 表 , 形式 参数 声明 形式 参数 声明 : 

声明 说 明 符 声明 符 声明 说 明 符 抽象 声明 符 opt 

在 这 种 新 式 的 声明 中 ， 形 式 参 数 表 指 定 了 形式 参数 的 类 型 。 这 里 有 一 个 
特例 ， 按 照 新 式 方式 声明 的 无 形式 参数 函数 的 声明 符 也 有 一 个 形式 参 
数 表 ， 该 表 仅 包含 关键 字 void。 如 果 形 式 参 SRW AHS, …" 结 尾 ， 
则 该 函数 可 接受 的 实际 参数 个 数 比 显 式 说 明 的 形式 参数 个 数 要 多 。 详 
细 信 息 参 见 A.7.3 节 。 

如 果 形 式 参 数 类 型 是 数组 或 函数 ， 按 照 参数 转换 规则 (参见 A.10.1 节 )， 
它们 将 被 转换 为 指针 。 形 式 参 数 的 声明 中 惟一 允许 的 存储 类 说 明 符 是 
register， 并 且 ， 除 非 函 数 定 义 的 开 头 包 括 函 数 声 明 符 ， 否 则 该 存储 类 
说 明 符 将 被 忽略 。 类 似 地 ， 如 果 形 式 参 数 声 明 中 的 声明 符 包含 标识 
符 ， 且 函数 定义 的 开头 没有 函数 声明 符 ， 则 该 标识 符 超 出 了 作用 域 。 不 
涉及 标识 符 的 抽象 声明 符 将 在 A.8.8 节 中 讨论 。 

在 旧式 的 函数 声明 TD P, WR DERA FIER: 

D1( 标 识 符 表 opt) 

并 且 声 明 D1 中 的 标识 符 的 类 型 是 "类 型 修饰 符 T"， 则 DD 的 标识 符 类 型 
为 "返回 工 类 型 值 且 未 指定 参数 的 6 类 型 修饰 符 ' 类 型 的 函数 "。 形 式 参 数 
(如 果 有 的 话 ) 的 形式 如 下 : 


标识 符 表 : 


























标识 符 


0 标识 符 在 旧式 的 声明 符 中 ， 除 非 在 函数 定义 的 前 面 使 用 了 声 
明 符 ， 人 和 否则， 标识 符 表 必须 空缺 (参见 


A.10.1 节 )。 声 明 不 提供 有 关 形 式 参数 类 型 的 信息 。 
例如 ， 下 列 声 明 : 
int {(), *fpi(), (*pfiO; 


声明 了 一 个 返回 整 型 值 的 函数 人 一 个 返回 指向 整 型 的 指针 的 函数 fpi 以 
及 一 个 指向 返 回 整 
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9 声明 。 


在 下 列 新 式 的 声明 中 : 
int strcpy(char *dest, const char *source), rand(void); 


strcpy 是 一 个 返回 int 类 型 的 函数 ， 它 有 两 个 实际 参数 ， 第 一 个 实际 参 
数 是 一 个 字符 指针 ， 第 一 个 实际 参数 星 一 个 指 癌 常量 字符 的 指针 。 其 
中 的 形式 参数 名 字 可 以 起 到 注释 说 明 的 作用 。 第 二 个 函数 rand 不 带 参 
数 ， 且 返回 类 型 为 int。 

说 明 : 到 目前 为 止 ， 带 形式 参数 原型 的 函数 声明 符 是 ANSI 标准 中 引入 的 
最 重要 的 一 个 语 言 变化 。 它 们 优 于 第 工 版 中 的 "旧式 "声明 符 ， 因 为 它们 
提供 了 函数 调用 时 的 错误 检查 和 参数 强制 转换 ， 但 引入 的 同时 也 市 来 
了 很 多 混乱 和 矿 烦 ， 而 且 还 必须 兼 客 这 两 种 形式 。 为 了 保 RHE, 
不 得 不 在 语法 上 进行 一 些 处 理 ， 即 采用 void 作为 新 式 的 无 形式 参数 函 
数 的 显 式 标 记 。 

采用 省 略 号 “, "表示 函数 变 长 参数 表 的 做 法 也 是 ANSI 标准 中 新 引入 
的 ， 并 且 ， 结 合 标 准 头 文件 <stdarg.h> 中 的 一 些 宏 ， 共 同 将 这 个 机 制 正 
式 化 了 。 该 机 制 在 第 1 版 中 是 官 方 上 禁止 的 ， 但 可 非 正 式 地 使 用 。 

这 些 表 示 法 起 源 于 C++。 

A.8.7 初始 化 

声明 对 象 时 ， 对 象 的 初始 化 声明 符 可 为 其 指定 一 个 初始 值 。 初 值 紧 跟 在 
运算 符 = 之 后 ， 它 可 以 是 一 个 表达 式 ， 也 可 以 是 藤 套 在 花 括 号 中 的 初 值 
序列 。 初 值 序 列 可 以 以 各 号 结束 ， 这 样 可 以 使 格式 简洁 美观 。 

初 值 : 

赋值 表达 式 

{ 初 值 表 } 


{ 初 值 表 ,} 











初 值 表 : 
YHE 
初 值 表 , 初 值 


对 静态 对 象 或 数组 而 言 ， 初 值 中 的 所 有 表达 式 必 须 是 A.7.19 节 中 描述 
的 常量 表达 式 。 如 果 初 值 是 用 论 括号 括 起 来 的 初 值 表 ， 则 对 auto 或 
register 类 型 的 对 象 或 数组 来 说 ， 初 值 中 的 表达 式 也 同样 必须 是 常量 表 
达 式 。 但 是 ， 如 果 上 自动 对 象 的 初 值 是 一 个 单个 的 表达 式 ， 则 它 不 必 是 
常量 表达 式 ， 但 必须 符合 对 象 赋值 的 类 型 要 求 。 


说 明 :第 1 版 不 文 持 目 动 结构 、 联 合 或 数组 的 初始 化 。 而 ANSI 标准 是 允 
许 的 ， 但 只 能 通过 第 量 结构 进行 初始 化 ， 除 非 初 值 可 以 通过 简单 表达 
式 表示 出 来 。 

未 显 式 初始 化 的 静态 对 象 将 被 隐 式 初始 化 ， 其 效果 等 同 于 它 ( 或 它 的 成 
员 ) 被 赋 以 常量 0。 未 显 式 初始 化 的 目 动 对 象 的 初始 值 没 有 定义 。 











指针 或 算术 类 型 对 象 的 初 值 是 一 个 单个 的 表达 式 ， 也 可 能 括 在 花 括 扎 
中 。 该 表达 式 将 赋 值 给 对 象 。 


结构 的 初 值 可 以 是 类 型 相同 的 表达 式 ， 也 可 以 是 括 在 花 括 号 中 的 按 其 成 
员 次 序 排列 的 初 值 表 。 无 名 的 位 字段 成 员 将 被 忽略 ， 因 此 不 被 初始 
化 。 如 采 表 中 初 值 的 数目 比 结构 的 成 员 数 少 ， 则 后 面 余 下 的 结构 成 员 
将 被 初始 化 为 0。 初 值 的 数目 不 能 比 成 员 数 多 。 


数组 的 初 值 是 一 个 括 在 花 括 号 中 的 、 由 数组 成 员 的 初 值 构成 的 表 。 如 果 
数组 大 小 未 知 ， 则 初 值 的 数目 将 决定 数组 的 大 小 ， 从 而 使 数组 类 型 成 
为 完整 类 型 。 若 数组 大 小 固定 ， 则 初 值 的 数目 不 能 超过 数组 成 员 的 数 
人 
被 初始 化 为 0。 


这 里 有 一 个 特例 :字符 数组 可 用 字符 串 字 面值 初始 化 。 字 符 串 中 的 各 个 
字符 依次 初始 化 数组 中 的 相应 成 员 。 类 似 地 ， 宽 字符 字面 值 (参见 A.2.6 
节 ) 可 以 初始 化 wchar_t 类 型 的 数 组 。 若 数组 大 小 未 知 ， 则 数组 大 小 将 
由 字符 串 中 字符 的 数目 (包括 尾部 的 空 字符 ) 决 定 。 奉 数组 大 小 固定 ， 则 
字符 串 中 的 字符 数 (不 计 尾 部 的 空 字符 ) 不 能 超过 数组 的 大 小 。 


联合 的 初 值 可 以 是 类 型 相同 的 单个 表达 式 ， 也 可 以 是 括 在 花 括号 中 的 联 
合 的 第 一 个 成 员 的 初 值 。 


说 明 :第 1 版 不 允许 对 联合 进行 和 始 化 。 "第 一 个 成 员 " 规 则 并 不 很 完美 ， 
但 在 没有 新 语 法 的 情况 下 很 难 对 它 进 行 一 般 化 。 除 了 至 少 允 许 以 一 种 
简单 方式 对 联合 进行 亚 式 初始 化 外 ， ANSI 规则 还 给 出 了 非 显 式 初始 化 
的 静态 联合 的 精确 语义 。 


聚集 是 一 个 结构 或 数组 。 如 采 一 个 聚集 包含 聚集 类 型 的 成 员 ， 则 初始 化 
时 将 递归 使 用 初 始 化 规则 。 在 下 列 情况 的 初始 化 中 可 以 省 略 括 号 :如 果 
聚集 的 成 员 也 足 一 个 聚集 ， 且 该 成 员 的 初始 化 符 以 左 花 括号 开头 ， 则 
后 续 部 分 中 用 逗号 隔 开 的 初 值 表 将 初始 化 子 聚 集 的 成 员 。 初 值 的 数目 
不 允许 超过 成 员 的 数目 。 但 是 ， 如 果子 聚集 的 初 值 不 以 左 花 括号 开头 ， 
则 只 从 初 值 表 中 取出 足够 数目 的 元 素 作 为 于 聚集 的 成 员 ， 其 它 剩 余 的 
成 员 将 用 来 初始 化 该 子 聚 集 所 在 的 聚集 的 下 一 个 成 员 。 


例如 : 


























int x[]={ 1, 3,5}; 


将 x 声明 并 初始 化 为 一 个 具有 3 个 成 员 的 一 维 数组 ， 这 是 因为 ， 数 组 未 
指定 大 小 且 有 3 个 初 值 。 下 面 的 例子 : 


float y[4][3] = { 


Hi 
Hil 


是 一 个 完全 用 花 括 号 分 隔 的 初始 化 :1、3 和 5 这 3 个 数 初始 化 数组 y[0] 
的 第 一 行 ， 即 y[0J[0]、 yoM y[0][2]。 类 似 地 ， 男 两 行将 初始 化 yi 
和 y[2]。 因 为 初 值 的 数目 不 够 ， 所 以 y[3] 中 的 元 素 将 被 初始 化 为 0， 完 











全 相同 的 效果 还 可 以 通过 下 列 声明 获得 : 


float y[4][3] = { 

1, 3, 5, 2, 4, 6, 3, 5, 7 

上 

y 的 初 值 以 左 花 括号 开始 ， 但 y[0] 的 初 值 则 没有 以 左 花 括号 开始 ， 因 此 
y[0] 的 初始 化 将 使 用 表 中 的 3 个 元 素 。 同 理 ，y[1] 将 使 用 后 续 的 3 个 元 
素 进 行 初 始 化 ，y[2] 依 此 类 推 。 男 外 ， 下列 声明 : 

float y[4][3] = { 

{1 RLZ RES h14] 

F 


将 初始 化 y 的 第 一 列 (将 y 看 成 为 一 个 二 维 数组 )， 其 余 的 元 素 将 默认 初 
始 化 为 0。 最 后 


char msg[] = "Syntax error on line %s\n"; 


声明 了 一 个 字符 数组 ， 并 用 一 个 字符 串 字 面值 初始 化 该 字符 数组 的 元 
素 。 该 数组 的 大 小 包括 尾部 的 空 字符 。 


A.8.8 类 型 名 

在 某 些 上 下 文中 (例如 ， 需 要 显 式 进行 强制 类 型 转换 、 需 要 在 函数 声明 
符 中 声明 形式 参 数 类 型 、 作 为 sizeof 的 实际 参数 等 )， 我 们 需要 提供 数 
据 类 型 的 名 字 。 使 用 类 型 名 可 以 解决 这 个 问题 ， 从 语法 上 讲 ， 也 就 是 
对 某 种 类 型 的 对 象 进 行 声明 ， 只 是 省 略 了 对 象 的 名 字 而 已 。 

类 型 名 : 

说 明 符 限定 符 表 抽象 声明 符 opt 

抽象 声明 符 : 指针 

KET opt 直接 抽象 声明 符 直接 抽象 声明 符 





(抽象 声明 符 ) 
直接 抽象 声明 符 opt [常量 表达 式 opt] 
直接 抽象 声明 符 opt (形式 参数 类 型 表 opt) 


如 末 该 结构 是 声明 中 的 一 个 声明 符 ， 残 有 可 能 惟一 确定 标识 符 在 抽象 声 
明 符 中 的 位 置 。 命 名 的 类 型 将 与 假设 标识 符 的 类 型 相同 。 例 如 : 


int int * 


int *[3] int (*)[] int *Q 

int (*[])(void) 

其 中 的 6 个 声明 分 别 命名 了 下 列 类 型 :“ 整 型 *、“ 指 向 整 型 的 指针 、“ 包 
含 3 个 指向 整 型 的 指针 的 数组 "”、“ 指 向 未 指定 元 素 个 数 的 整 型 数组 的 指 
针 ”“ 未 指定 参数 、 返 回 指向 整 型 的 指 针 的 函数 ”"、“ 一 个 数组 ， 其 长 度 
a eee eee 
A.8.9 typedef 


存储 类 说 明 符 为 typedef 的 声明 不 用 于 声明 对 象 ， 而 是 定义 为 类 型 命名 
的 标识 符 。 这 些 标识 符 称 为 类 型 定义 名 。 


类 型 定义 名 : 











标识 符 

typedef 声明 按照 普通 的 声明 方式 将 个 类 型 指派 给 其 声明 符 中 的 每 个 名 
字 (参见 A.8.6 节 )。 此 后 ， 类 型 定义 名 在 语法 上 就 等 价 于 相关 类 型 的 类 
型 说 明 符 关键 字 。 


例如 ， 在 定义 





typedef long Blockno, *Blockptr; 

typedef struct { double r, theta; } Complex; 
之 后 ， 下 述 形式 : 

Blockno b; 

extern Blockptr bp; Complex z, *zp; 


都 是 合法 的 声明 。b 的 类 型 为 long，bp 的 类 型 为 "指向 long 类 型 的 指 
针 "。z 的 类 型 为 指 


定 的 结构 类 型 ，zp 的 类 型 为 指 癌 该 结构 的 指针 。 

typedef 类 型 定义 并 没有 引入 新 的 类 型 ， 它 只 是 定义 了 数据 类 型 的 同 义 
词 ， 这 样 ， 就 可 以 通过 另 一 种 方式 进行 类 型 声明 。 在 本 侧 中 ，b 与 其 它 
任何 long 类 型 对 象 的 类 型 相同 。 


类 型 定义 名 可 在 内 层 作 用 域 中 重新 声明 ， 但 必须 给 出 一 个 非 空 的 类 型 说 
明 符 集合 。 例 如 ， 下 列 声明 : 











extern Blockno; 


并 没有 重新 声明 Blockno， 但 下 列 声 明 : extern int Blockno; 


则 重新 声明 了 Blockno。 

A.8.10 类 型 等 价 

如 果 两 个 类 型 说 明 符 表 包 含 相 同 的 类 型 说 明 符 集合 (需要 考虑 类 型 说 明 
FEZ ERRAR 系 ， 例 如， 单独 的 long Zi S long int)， 则 这 两 个 类 型 
说 明 符 表 是 等 价 的 。 具 有 不 同 标 记 的 结构 、 不 同 标记 的 联合 和 不 同 标 
记 的 枚 举 是 不 等 价 的 ， 无 标记 的 联合 、 无 标记 的 结构 或 无 标记 的 枚 举 
中 定 的 类 型 也 是 不 等 价 的 。 

在 展开 其 中 的 任何 typedef 类 型 并 删除 所 有 函数 形式 参数 标识 符 后 ， 如 
果 两 个 类 型 的 抽 象 声 明 符 (参见 A.8.8 节 ) 相 同 ， 且 它们 的 类 型 说 明 符 表 
等 价 ， 则 这 两 个 类 型 是 相同 的 。 数 组 长 度 和 函数 形式 参数 类 型 是 其 中 
很 重要 的 因素 。 


A.9 语句 


如 末 不 特别 指明 ， 语 句 都 是 顺序 执行 的 。 语 句 执行 都 有 一 定 的 结果 ， 但 
没有 值 。 语 句 可 分 为 几 种 类 型 。 


语句 |: 

带 标号 语句 表达 式 语句 复合 语句 选择 语句 循环 语句 跳 转 语句 
A.9.1 带 标号 语句 

语句 可 带 有 标号 前 级 。 带 标号 语句 : 

标识 符 : 语句 

case 常量 表达 式 : 语句 


default: 语句 由 标识 符 构 成 的 标号 声明 了 该 标识 符 。 标 识 符 标 号 的 惟一 
用 途 就 是 作为 goto 87) Nee A 


标 。 标 识 符 的 作用 域 是 当前 函数 。 因 为 标号 有 目 己 的 名 学 空间 ， 因 此 不 
会 与 其 它 标 识 符 混 消 ， 




















并 且 不 能 被 重新 声明 。 详 细 信 息 参 见 A.11.1 节 。 


case 标号 和 default 标号 用 在 switch 语句 中 (参见 A.9.4 节 )。case 标号 中 
的 常量 


表达 式 必须 为 整 型 。 

标号 本 身 不 会 改变 程序 的 控制 流 。 

A.9.2 表达 式 语句 

大 部 分 语句 为 表达 式 语句 ， 其 形式 如 下 所 示 : 表达 式 语句 : 

表达 式 opt; 

大 多 数 表达 式 语句 为 赋值 语句 或 函数 调用 语句 。 表 达 式 引起 的 所 有 副 作 
用 在 下 一 条 语句 执行 前 结束 。 没 有 表达 式 的 语句 称 为 空 语句 。 空 语句 
常常 用 来 为 循环 语句 提供 一 个 空 的 循环 体 或 设置 标号 。 

A.9.3 合 语句 


当 需 要 把 在 干 条 语句 作为 一 条 语句 使 用 时 ， 可 以 使 用 复合 语句 (也 称 
为 "程序 块 ")。 函 数 定义 中 的 函数 体 束 是 一 个 复合 语句 。 


合 语句 : 

{声明 表 opt 语句 表 opt} 
声明 表 : 

声明 
声明 表 声明 a A 
语句 


语句 表 语句 如 果 声 明 表 中 的 标识 符 位 于 程序 块 外 的 作用 域 中 ， 则 外 部 
声明 在 程序 块 内 将 被 挂 起 (参见 

















A.11.1 节 )， 在 程序 块 之 后 再 恢复 其 作用 。 在 同一 程序 块 中 ， 一 个 标识 
符 只 能 声明 一 次 。 此 规 


则 也 适用 于 同一 名 字 空 间 的 标识 符 ( 参 见 A.11 市 )， 不 同名 字 空 间 的 标 


识 符 被 认为 是 不 同 的 。 

自动 对 象 的 初始 化 在 每 次 进入 程序 块 的 顶端 时 执行 ， 执 行 的 顺序 按照 声 
明 的 顺序 进行 。 如 果 执 行 跳 转 语句 进入 程序 块 ， 则 不 进行 初始 化 。 
Static 类 型 的 对 象 仅 在 程序 开始 执行 前 初 始 化 一 次 。 

A.9.4 选择 语句 


选择 语句 包括 下 列 几 种 控制 流 形式 : 选择 语句 : 





if (REIN) 语句 
if (表达 式 ) 语句 else 语句 
switch (表达 式 ) 语句 


在 两 种 形式 的 让 语句 中 ， 表 达 式 (必须 为 算术 类 型 或 指针 类 型 ) 首 先 被 求 
值 ( 包 括 所 有 的 副作用 )， 如 果 不 等 于 0， 则 执行 第 一 个 子 语句 。 在 第 二 
种 形式 中 ， 如 果 表 达 式 为 0， 则 执 行 第 二 个 子 语句 ， 通 过 将 else 与 同一 
KE RA ANGE A EA ARE BE else 的 让 相连 接 ， 可 以 解决 else 的 歧义 


性 问题 。 


switch 语句 根据 表达 式 的 不 同 取 值 将 控制 转 癌 相应 的 分 文 。 关 键 字 
switch 之 后 用 圆 括 号 括 起 来 的 表达 式 必 须 为 整 型 ， 此 语句 控制 的 子 语句 
一 般 是 复合 语句 。 子 语句 中 的 任何 语句 可 带 一 个 或 多 个 case 标号 (参见 
A.9.1 节 )。 控 制 表 达 式 需要 进行 整 型 提升 (参见 A.6.1 节 )， case 常量 将 
被 转换 为 整 型 提升 后 的 类 型 。 同 一 switch 语句 中 的 任何 两 个 case 常量 
在 转换 后 不 能 有 相同 的 值 。 一 个 switch 语句 最 多 可 以 有 一 个 default 标 
+s. switch 语句 可 以 从 Æ, case 或 default 标号 与 包含 它 的 最 近 的 
switch 相关 联 。 

switch 语句 执行 时 ， 首 先 计 算 表 达 式 的 值 及 其 副作用 ， 并 将 其 值 与 每 个 
case 和 常量 比较 ， 如 果 某 个 case 篆 量 与 表达 式 的 值 相 同 ， 则 将 控制 转 回 
与 该 case 标号 匹配 的 语句 。 如 果 没 有 case 各 量 与 表达 式 匹 配 ， 并 且 有 
default 标号 ， 则 将 控制 转 癌 default 标号 的 语句 。 如 果 没 有 case % VL 
配 ， 且 没有 default 标号 ， 则 switch 语句 的 所 有 子 语句 都 不 执行 。 


说 明 : 在 本 书 第 1 版 中 ，switch 语句 的 控制 表达 式 与 case 常量 都 必须 为 


int 类 型 。 

A.9.5 循环 语句 

循环 语句 用 于 指定 程序 段 的 循环 执行 。 循环 语句 
while (表达 式 ) 语句 

do 语句 while (表达 式 ); 





























for (表达 式 opt; 表达 式 opt; 表达 式 opt) 语句 


在 while 语句 和 do 语句 中 ， 只 要 表达 式 的 值 不 为 0， 其 中 的 子 语句 将 一 
直 重 复 执行 。 表 达 式 必须 为 算术 类 型 或 指针 类 型 。while 语句 在 语句 执 
行 前 测试 表达 式 ， 并 计算 其 副作用 ， 而 do 语句 在 每 次 循环 后 测试 表达 


TN 








在 for 语句 中 ， 第 一 个 表达 式 只 计算 一 次 ， 用 于 对 循环 初始 化 。 该 表达 
式 的 类 型 没有 限 制 。 第 二 个 表达 式 必 须 为 算术 类 型 或 指针 类 型 ， 在 每 
次 开始 循环 前 计算 其 值 。 如 果 该 表达 式 的 值 等 于 0， 则 for 语句 终止 执 
行 。 第 三 个 表达 式 在 每 次 循环 后 计算 ， 以 重新 对 循环 进行 初 始 化 ， 其 
类 型 没有 限制 。 所 有 表达 式 的 副作用 在 计算 其 值 后 立即 结束 。 如 果子 语 
句 中 没有 continue 语句 ， 则 语句 


for (表达 式 1; 表达 式 2; 表达 式 3) 语句 等 价 于 








表达 式 1; 

while (表达 式 2) { 
语句 表达 式 3; 
} 


for 语句 中 的 3 个 表达 式 中 都 可 以 省 略 。 第 二 个 表达 式 省 略 时 等 价 于 测 
试 一 个 非 0 常量 。 


A.9.6 跳 转 语句 

跳 转 语句 用 于 无 条 件 地 转移 控制 。 跳 转 语句 : 
goto 标识 符 ; continue; 

break; 

return 表达 式 opt; 


在 goto 语句 中 ， 标 识 符 必须 是 位 于 当前 函数 中 的 标号 (参见 A.9.1 节 )。 
控制 将 转移 到 标号 指 定 的 语句 。 


continue 语句 只 能 出 现在 循环 语句 内 ， 它 将 控制 转 问 包含 此 语句 的 最 内 
层 循环 部 分 。 更 准确 地 说 ， 在 下 列 任 一 语句 中 : 


while (...) { do { for (...) { 
contin: ; contin: ; contin: ; 
} } while (...); } 


WR continuet 语句 不 包含 在 更 小 的 循环 语句 中 ， 则 其 作用 与 goto contin 


语句 等 价 。 


break 语句 只 能 用 在 循环 语句 或 switch 语句 中 ， 它 将 终止 包含 该 语句 的 
最 内 层 循环 语 句 的 执行 ， 并 将 控制 转 癌 被 终止 语句 的 下 一 条 语句 。 


return 语句 用 于 将 控制 从 函数 返回 给 调用 者 。 当 retum 语句 后 跟 一 个 表 
达 式 时 ， 表 达 式 的 值 将 返回 给 函数 调用 者 。 像 通过 赋值 操作 转换 类 型 
那样 ， 该 表达 式 将 被 转换 为 它 所 在 的 函数 的 返回 值 类 型 。 


控制 到 达 函 数 的 结尾 等 价 于 一 个 不 禹 表达 式 的 retum 语句 。 在 这 两 种 情 
况 下 ， 返 回 值 都 是 没有 定义 的 。 


A.10 外 部 声明 


提供 给 C 编译 器 处 理 的 输入 单元 称 为 翻译 单元 。 它 由 一 个 外 部 声明 序列 
组 成 ， 这 些 外 部 声明 可 以 是 声明 ， 也 可 以 是 函数 定义 。 


翻译 单元 : 

外 部 声明 

翻译 单元 外 部 声明 外 部 声明 : 

函数 定义 声明 

与 程序 块 中 声明 的 作用 域 持续 到 整个 程序 块 的 末尾 类 似 ， 外 部 声明 的 作 
用 域 一 直 持 续 到 其 所 在 的 翻译 单元 的 末尾 。 外 部 声明 除了 只 能 在 这 一 
级 上 给 出 函数 的 代码 外 ， 其 语法 规则 与 其 它 所 有 声明 相同 。 

A.10.1 函数 定义 

函数 定义 具有 下 列 形式 : 函数 定义 : 


声明 说 明 符 opt 声明 符 声明 表 opt 复合 语句 声明 说 明 符 中 只 能 使 用 存储 
类 说 明 符 extern 或 static。 有 关 这 两 个 存储 类 说 明 符 之 间 的 区 

别 ， 参 见 A.11.2 节 。 

函数 可 返回 算术 类 型 、 结 构 、 联 合 、 指 针 或 vold 类 型 的 值 ， 但 不 能 返 
回 函 数 或 数组 类 型 。 函数 声明 中 的 声明 符 必 须 显 式 指 定 所 声明 的 标识 
符 具有 函数 类 型 ， 也 束 是 说 ， 必 须 包 含 下 列 两 种 形式 之 一 (参见 A.8.6 
TW): 


直接 声明 符 (形式 参数 类 型 表 ) 直接 声明 符 (标识 符 表 opt) 


其 中 ， 和 直接 声明 符 可 以 为 标识 符 或 用 圆 括 号 括 起 来 的 标识 符 。 特 别 是 ， 
不 能 通过 typedef 定 X AAKA, 


第 一 种 形式 是 一 种 新 式 的 函数 定义 ， 其 形式 参数 及 类 型 都 在 形式 参数 类 
型 表 中 声明 ， 函 数 声 明 符 后 的 声明 表 必 须 空 缺 。 除 了 形式 参数 类 型 表 




















中 只 包含 void 类 型 (表明 该 函数 没有 形 式 参数 ) 的 情况 外 ， 形 式 参数 类 型 
表 中 的 每 个 声明 符 都 必须 包含 一 个 标识 符 。 如 果 形 式 参数 类 型 表 以 “， 
…" 结 束 ， 则 调用 该 函数 时 所 用 的 实际 参数 数目 就 可 以 多 于 形式 参数 数 
Ho va arg 宏 机 制 在 标准 头 文件 <stdarg.h) 中 定义 ， 必 须 使 用 它 来 引用 
额外 的 参数 ， 我 们 将 在 附录 B 中 介绍 。 带 有 可 变形 式 参 数 的 函数 必须 
至 少 有 一 个 命名 的 形式 参数 。 


第 二 种 形式 是 一 种 旧式 的 函数 定义 :标识 符 表 列 出 ， 形 式 参 数 的 名 字 ， 
这 些 形式 参数 的 











类 型 由 声明 表 指 定 。 对 于 未 声明 的 形式 参数 ， 其 类 型 默认 为 int 类 型 。 
声明 表 必 须 只 声明 标 识 符 表 中 指定 的 形式 参数 ， 不 允许 进行 初始 化 ， 
并 且 仅 可 使 用 存储 类 说 明 符 register. 


在 这 两 种 方式 的 函数 定义 中 ， 可 以 这 样 理解 形式 参数 :在 构成 函数 体 的 
合 语句 的 开始 处 进行 声明 ， 并 且 在 该 复合 语句 中 不 能 重复 声明 相同 
的 标识 符 ( 但 可 以 像 其 它 标识 符 一 样 在 该 复合 语句 的 内 层 程序 块 中 重新 
声明 )。 如 果 东 一 形式 参数 声明 的 类 型 为 ” type 类 型 的 数组 "， 则 该 声明 
将 会 被 目 动 调整 为 " 指 问 type RATT". Ah, WRIA BASE 
数 声明 为 " 返 回 type 类 型 值 的 函数 "， 则 该 声明 将 会 被 调整 为 " 指 网 返回 
type 类 型 值 的 函数 的 指针 "。 调 用 函数 时 ， 必 要 时 要 对 实际 参数 进行 类 

型 转换 ， 然 后 赋值 给 形式 参数 ， 详 细 信 息 参 见 A.7.3 节 。 


说 明 : 新 式 函 数 定义 是 ANSI 标准 新 引入 的 一 个 特征 。 有 关 提 升 的 一 些 细 
节 也 有 细微 的 变化。 第 1 版 指定 ，float 类 型 的 形式 参数 声明 将 被 调整 
为 double 类 型 。 当 在 函数 内 部 生成 一 个 指 回 形 式 参数 的 指针 时 ， 它 们 
之 间 的 区 别 就 显而易见 了 。 


下 面 是 一 个 新 式 函 数 定 义 的 完整 例子 : 











int max(int a, int b, int c) 
{ 

int m; 

m = (a >b)? a:b; 
return (m > c)? m: C; 

} 


其 中 ，int 是 声明 说 明 符 ;max(int a, int b, int @O 是 函数 的 声明 符 ;{...} 是 函 
数 代 码 的 程序 块 。 相 应 的 旧式 定义 如 下 所 示 : 


int max(a, b, c) 


int a, b, c; 


其 中 ，int max(a, b, oO 是 声明 符 ，int a, b, c; 是 形式 参数 的 声明 表 。 

A.10.2 外 部 声明 

外 部 声明 用 于 指定 对 象 、 函 数 及 其 它 标识 符 的 特性 。 术 语 " 外 部 "表明 它 
们 位 于 函数 外 部 ， 并 且 不 直接 与 关键 字 extern 连接 。 外 部 声明 的 对 象 
可 以 不 指定 存储 类 ， 也 可 指定 为 extern 或 static. 


同一 个 标识 符 的 多 个 外 部 声明 可 以 共存 于 同一 个 翻译 单元 中 ， 但 它们 的 
类 型 和 连接 必须 保持 一 致 ， 并 且 标 识 符 最 多 只 能 有 一 个 定义 。 








如 宁 一 个 对 象 或 函数 的 两 个 声明 遵循 A.8.10 市 中 所 述 的 规则 ， 则 认为 
它们 的 类 型 是 一 致 的 。 并 且 ， 如 宁 两 个 声明 之 间 的 区 别 仅仅 在 于 :其 中 
一 个 的 类 型 为 不 完整 结构 、 联 合 或 枚 举 类 型 (参见 A.8.3 市 )， 而 为 一 个 
是 对 应 的 带 同 一 标记 的 完整 类 型 ， 则 认为 这 两 个 类 型 是 一 致 的 。 此 
外 ， 如 果 一 个 类 型 为 不 完整 数组 类 型 (参见 A.8.6 市 )， 而 男 一 个 类 型 为 
完整 数组 类 型 ， 其 它 属性 都 相同 ， 则 认为 这 两 个 类 型 是 一 致 的 。 最 
后 ， 如 采 一 个 类 型 指定 了 一 个 旧式 函 数 ， 而 力 一 个 类 型 指定 了 带 形式 
a a a 
是 一 致 的 。 


如 条 一 个 对 象 或 函数 的 第 一 个 外 部 声明 包含 static 说 明 符 ， 则 该 标识 符 
具有 内 部 连接 ， 否则 具有 外 部 连接 。 有 关连 接 的 详细 信息 ， 参 见 
A.11.2 节 中 的 讨论 。 


如 果 一 个 对 象 的 外 部 声明 带 有 初 值 ， 则 该 声明 就 是 一 个 定义 。 如 果 一 个 
外 部 对 象 声 明 不 带 有 初 值 ， 并 且 不 包含 exten 说 明 答 ， 则 它 是 一 个 临 
时 定义 。 如 果 对 象 的 定义 出 现在 翻译 单元 中 。 则 所 有 临时 定义 都 将 仅 
仪 被 认为 是 多 余 的 声明 ;如 果 该 翻译 单元 中 不 存在 该 对 象 的 定义 ， 则 该 
临时 定义 将 转变 为 一 个 初 值 为 0 的 定义 。 


每 个 对 象 都 必须 有 且 仅 有 一 个 定义 。 对 于 具有 内 部 连接 的 对 象 ， 该 规则 
分 别 适用 于 每 个 翻译 单元 ， 这 是 因为 ， 内 部 连接 的 对 象 对 每 个 翻译 单 
元 是 惟一 的 。 对 于 具有 外 部 连接 的 对 象 ， 该 规则 适用 于 整个 程序 。 


说 明 : 虽 然 单 一 定义 规则 (One*definition rule) 在 表达 上 与 本 书 第 1 版 有 所 
不 同 ， 但 在 效果 上 是 等 价 的 。 某 些 实现 通过 将 临时 定义 的 概念 一 般 化 
而 放宽 了 这 个 限制 。 在 另 一 种 形式 中 ， 一 个 程序 中 所 有 翻译 单元 的 外 
部 连接 对 象 的 所 有 临时 定义 将 集中 进行 考虑 ， 而 不 是 在 各 翻译 单元 中 
分 别 考虑 ，UNIX 系统 通常 就 采用 这 种 方法 ， 并 且 被 认为 是 该 标准 的 一 
般 扩 展 。 如 果 定 义 在 程序 中 的 某 个 地 方 出 现 ， 则 临时 定义 仅 被 认为 是 
声明 ， 但 如 果 没 有 定义 出 现 ， 则 所 有 临时 定义 将 被 转变 为 初 值 为 0 的 
定义 。 


A.11 作用 域 与 连接 


一 个 程序 的 所 有 单元 不 必 同 时 进行 编译 。 源 文件 文本 可 保存 在 在 干 个 文 
件 中 ， 每 个 文件 中 可 以 包含 多 个 翻译 单元 ， 预 完 编译 过 的 例 程 可 以 从 



































库 中 进行 加 载 ， 程 序 中 函数 间 的 通信 可 以 通过 调用 和 操作 外 部 数据 来 
实现 。 


因此 ， 我 们 需要 考虑 两 种 类 型 的 作用 域 :第 一 种 是 标识 符 的 词法 作用 
域 ， 它 是 体现 标识 符 特 性 的 程序 文本 区 域 ;第 二 种 是 与 具有 外 部 连接 的 
对 象 和 函数 相关 的 作用 域 ， 它 决定 各 个 单独 编译 的 翻译 单元 中 标识 符 
之 间 的 连接 。 


A.11.1 词法 作用 域 


标识 符 可 以 在 奉 干 个 名 字 空 间 中 使 用 而 互 不 影响 。 如 果 位 于 不 同 的 名 字 
空间 中 ， 即 使 是 在 同一 作用 域内 ， 相 同 的 标识 符 也 可 用 于 不 同 的 目 
的 。 名 字 空 间 的 类 型 包括 :对 象 、 函 数 、 类 型 定义 名 和 枚 举 常量 ; 标 写 ; 结 
构 标 记 、 联 合 标 记 和 枚 举 标 记 ; 各 结构 或 联合 自身 的 成 员 。 


说 明 : 这 些 规则 与 本 手册 第 1 版 中 所 述 的 内 容 有 几 点 不 同 。 以 前 标号 没 
有 目 己 的 名 字 空 间 ; 结 构 标 记 和 联合 标记 分 别 有 各 目的 名 字 空 间 ， 在 茶 
些 实现 中 杖 举 标 记 也 有 自己 的 名 字 空 间 ; 把 不 同 种 类 的 标记 放 在 同一 名 
字 空 间 中 是 新 增加 的 限制 。 与 第 1 版 之 间 最 大 的 不 同 在 于 : 



































每 个 结构 和 联合 都 为 其 成 员 建 立 不 同 的 名 字 空 间 ， 因 此 同一 名 字 可 出 现 
在 多 个 不 同 的 结构 中 。 这 一 规则 在 最 近 几 年 使 用 得 很 多 。 


在 外 部 声明 中 ， 对 象 或 函数 标识 符 的 词法 作用 域 从 其 声明 结束 的 位 置 开 
始 ， 到 所 在 翻译 单元 结束 为 止 。 函 数 定 义 中 形式 参数 的 作用 域 从 定义 
函数 的 程序 块 开始 处 开始 ， 并 贯穿 整个 函数 ;函数 声明 中 形式 参数 的 作 
用 域 到 声明 符 的 来 尾 处 结束 。 程 序 其 头 部 中 声明 的 标识 符 的 作用 域 是 
其 所 在 的 整个 程序 块 。 标 写 的 作用 域 是 其 所 在 的 函数 。 结 构 标 记 、 联 合 
brid. BAS 标记 或 枚 举 常量 的 作用 域 从 其 出 现在 类 型 说 明 符 中 开始 ， 
rere a ee ern 
部 声明 而 言 )。 


如 果菜 一 标识 符 显 式 地 在 程序 块 (包括 构成 函数 的 程序 块 ) 头 部 中 声明 ， 
则 该 程序 块 外 部 中 此 标识 符 的 任何 声明 都 将 被 挂 起 ， 和 直到 程序 块 结 
再 恢复 其 作用 。 


A.11.2 连接 


在 翻译 单元 中 ， 具 有 内 部 连接 的 同一 对 象 或 函数 标识 符 的 所 有 声明 都 引 
用 同一 实体 ， 并 且 ， 该 对 象 或 函数 对 这 个 翻译 单元 来 说 是 惟一 的 。 具 
有 外 部 连接 的 同一 对 象 或 函数 标识 符 的 所 有 声明 也 引用 同一 实体 ， 并 
且 该 对 象 或 函数 是 航 整 个 程序 中 共 宇 的 。 


如 A.10.2 节 所 述 ， 如 果 使 用 了 static 说 明 符 ， 则 标识 符 的 第 一 个 外 部 声 
明 将 使 得 该 标 识 符 具有 内 部 连接 ， 人 否则 ， 该 标识 符 将 共有 外 部 连接 。 

如 末 程 友 块 中 对 一 个 标识 符 的 声明 不 包含 exten 说 明 符 ， 则 该 标识 符 
没有 连接 ， 并 且 在 函数 中 是 惟一 的 。 如 果 这 种 声明 中 包含 extern 说 明 

从 ， 并 且 ， 在 包含 该 程序 块 的 作用 域 中 有 一 个 该 标识 符 的 外 部 声明 ， 则 
该 标识 符 与 该 外 部 声明 具有 相同 的 连接 ， 并 引用 同一 对 象 或 函数 。 但 
是 ， 如 果 没 有 可 见 的 外 部 声明 ， 则 该 连接 是 外 部 的 。 


A.12 预 处 理 


预 处 理 器 执行 宏 普 换 、 条 件 编译 以 及 包含 指定 的 文件 ， 以 #7 头 的 命令 
行 (< # 前 可 以 有 空格 ) 就 是 预 处 理 器 处 理 的 对 象 。 这 些 命令 行 的 语法 
独立 于 语言 的 其 它 部 分 ， 它 们 可 以 出 现 在 任何 地 方 ， 其 作用 可 延续 到 
所 在 翻译 单元 的 末尾 (与 作用 域 无 关 )。 行 边界 是 有 实际 意义 的 ; 每 一 行 都 






































将 单独 进行 分 析 ( 有 关 如 何 将 行 连结 起 来 的 详细 信息 参见 A.12.4 节 )。 对 
预 处 理 喜 而 言 ， 记 号 可 以 是 任何 语言 记号 ， 也 可 以 是 类 似 于 下 nclude 指 
令 ( 参 见 A.12.4 节 ) 中 表示 文件 名 的 字符 序列 ， 此 外 ， 所 有 未 进行 其 它 定 
义 的 字符 都 将 被 认为 是 记号 。 但 是 ， 在 预 处 理 器 指令 行 中 ， 除 空格 、 
横 问 制 表 符 外 的 其 它 空白 符 的 作用 是 没有 定义 的 。 


预 处 理 过 程 在 逻辑 上 可 以 划分 为 几 个 连续 的 阶段 (在 茶 些 特殊 的 实现 中 
可 以 缩减 )。 


1) 首 先 ， 将 A.12.1 市 所 述 的 三 字符 序列 丛 换 为 等 价 字 人 符 。 如 果 操 作 系 统 
环境 需要 ， 还 要 在 源 文件 的 各 行 之 间 插 入 换行 符 。 


Ti). 

2) 将 指令 行 中 位 于 换行 符 前 的 反 斜 杠 符 \ 删 除 掉 ， 以 把 各 指令 行 连接 起 来 
(参见 ”A.12.2 

3) 将 程序 分 成 用 空白 符 分 隔 的 记号 。 注 释 将 被 替换 为 一 个 空白 符 。 接 着 
执行 预 处 理 指令 ， 并 进行 宏 扩 展 (参见 A.12.3 市 IA.12.10 节 )。 





























4 将 字符 常量 和 字符 串 字 面值 中 的 转 义 字符 序列 (参见 A.2.5 市 与 A.2.6 
DERN 等 价 字 符 ， 然 后 把 相 邻 的 字符 串 字 面值 连接 起 来 。 


5) 收 集 必 要 的 程序 和 数据 ， 并 将 外 部 函数 和 对 象 的 引用 与 其 定义 相连 
接 ， 翻 译 经 过 以 上 处 理 得 到 的 结果 ， 然 后 与 其 它 程序 和 库 连 接 起 来 。 


A.12.1 三 字符 序列 








C 语 育 源 程序 的 字符 集 是 7 位 ASCII 码 的 子 集 ， 但 它 是 ISO 646。1983 
不 变 代码 集 的 超 集 。 为 了 将 程序 通过 这 种 缩减 的 字符 集 表 示 出 来 ， 下 
列 所 示 的 所 有 三 字符 序列 都 要 用 相应 的 单个 字符 替换 ， 这 种 替换 在 进 
行 所 有 它 他 处 理 之 前 进行 。 





"| 


除 此 之 外 不 进行 其 它 蔡 换 。 说 明 : 三 字符 序列 是 ANSI 标准 新 引入 的 特 
征 。 











A.12.2 行 连接 


通过 将 以 反 斜 杠 \ 结 束 的 指令 行 末尾 的 反 斜 杠 和 其 后 的 换行 符 删 除 掉 。 
可 以 将 若干 指令 行 合并 成 一 行 。 这 种 处 理 要 在 分 隔 记号 之 前 进行 。 


A.12.3 宏 定 义 和 扩 展 
类 似 于 下 列 形式 的 控制 指令 : 





#define 标识 符 记号 序列 将 使 得 预 处 理 器 把 该 标识 符 后 续 出 现 的 各 个 实 
例 用 给 定 的 记号 序列 蔡 换 。 记 号 序列 前 后 的 空 


白 符 都 将 被 丢弃 掉 。 第 二 次 用 #adefine 指令 定义 同一 标识 符 是 错误 的 ， 
除非 第 二 次 定义 中 的 


标记 序列 与 第 一 次 相同 (所 有 的 空白 分 阳 符 被 认为 是 相同 的 )。 
类 似 于 下 列 形式 的 指令 行 : 


#define 标识 符 (标识 符 表 opt) 记号 序列 是 一 个 带 有 形式 参数 (由 标识 符 

表 指 定 ) 的 宏 定 义 ， 其 中 第 一 个 标识 符 与 圆 括号 (之 间 没 有 

空格 。 同 第 一 种 形 陈 一 样 ， 记 号 序列 前 后 的 空白 符 都 将 被 丢弃 把。 如 果 
要 对 宏 进 行 重 定 义 ， 

则 必须 保证 其 形式 参数 个 数 、 拼 写 及 记号 序列 都 必须 与 前 面 的 定义 相 


同 









































类 似 于 下 列 形式 的 控制 指令 : 


#undef 标识 符 





用 于 取消 标识 符 的 预 处 理 器 定义 。 将 #undef 应 用 于 未 知 标识 符 ( 即 未 用 
#define 指令 定义 的 标识 符 ) 并 不 会 导致 错误 。 


按照 第 二 种 形式 定义 宏 时 ， 宏 标识 符 (后 面 可 以 跟 一 个 空白 符 ， 空 白 符 
是 可 选 的 ) 及 其 后 用 一 对 圆 括号 括 起 来 的 、 由 逗号 分 阳 的 记 写 序列 就 构 
成 了 一 个 宏 调 用 。 宏 调用 的 实际 参数 是 用 去 号 分 隔 的 记号 序列 ， 用 引 
号 或 嵌 套 的 括号 括 起 来 的 逗号 不 能 用 于 分 隔 实 际 参数 。 在 处 理 过 程 
中 ， 实 际 参数 不 进行 宏 扩 展 。 宏 调用 时 ， 实 际 参 数 的 数目 必须 与 定义 中 
形式 参数 的 数 目 匹 配 。 实 际 参数 被 分 离 后 ， 前 导 和 尾部 的 空白 符 将 科 
删除 。 随 后 ， 由 各 实际 参数 产生 的 记 号 序列 将 蔡 换 未 用 引号 引起 来 的 
相应 形式 参数 的 标识 符 ( 位 于 寥 的 答 换 记号 序列 中 )。 除 非 蔡 换 序 列 中 的 
形式 参数 的 前 面 有 一 个 # 符 号 ， 或 者 其 前 面 或 后 面 有 一 个 棒 符 写 ， 众 
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两 个 特殊 的 运算 符 会 影响 替换 过 程 。 首 先 ， 如 果 蔡 换 记 号 序列 中 的 某 个 
形式 参数 前 面 直 接 是 一 个 # 符 号 (它们 之 间 没 有 空白 符 )， 相 应 形式 参数 
的 两 边 将 被 加 上 双 引 号 (0)， 随 后 ，# 和 形式 参数 标识 符 将 被 用 引号 引起 
来 的 实际 参数 痊 换 。 实 际 参数 中 的 字符 串 字 面值 、 字 符 毅 量 两 边 或 内 
部 的 每 个 双 引 号 (") 或 反 斜 杠 Q) 前 面 都 要 插入 一 个 反 斜 杠 ()。 


其 次 ， 无 论 哪 种 宏 的 定义 记 写 序列 中 包含 一 个 枯 运 算 符 ， 在 形式 参数 普 
BUR BECHER 其 前 后 的 空白 符 部 删除 挥 ， 以 便 将 相 邻 记号 连接 起 来 
形成 一 个 新 记号 。 如 果 这 样 产生 的 记号 无 效 ， 或 者 结果 依赖 于 检 运 算 
符 的 处 理 顺 序 ， 则 结果 没有 定义 。 同 时 ， 大 也 可 以 不 出 现在 蔡 换 记 号 
序列 的 开头 或 结尾 。 


对 这 两 种 类 型 的 安 ， 都 要 重复 扫描 蔡 换 记号 序列 以 碍 找 更 多 的 已 定义 标 
识 待 。 但 是 。 当 茶 个 标识 符 在 某 个 扩展 中 被 蔡 换 后 ， 再 次 扫描 并 再 次 
遇 到 此 标识 符 时 不 再 对 其 执行 将 换 ， 而 是 保持 不 变 。 

即使 执行 宏 扩 展 后 得 到 的 最 终结 果 以 灶头 ， 也 不 认为 它 是 预 处 理 指 


令 。 说 明 : 有 关 宏 扩展 处 理 的 细 市 信息 ，ANSI 标准 比 第 1 版 描述 得 更 详 
细 。 最 重要 的 变化 是 


加 入 了 # 和 fl 枯 运算 从， 这 就 使 得 引用 和 连接 成 为 可 能 。 东 些 新 规则 (特别 
是 与 连接 有 关 的 规则 ) 






















































































比较 独特 (参见 下 面 的 例子 )。 

例如 ， 这 种 功能 可 用 来 定义 "表示 常量 "， 如 下 例 所 示 : 

#define TABSIZE 100 int table[TABSIZE]; 

定义 

#define ABSDIFF(a, b) ((a)>(b) ? (a)e(b) : (b)*(a)) 

TE SNE, CHRIS SECS AZAR GSAT ERE RE AY eB 
所 不 同 的 是 ， 参 数 与 返回 值 可 以 是 任意 算术 类 型 ， 甚 至 可 以 是 指针 。 
同时 ， 参 数 可 能 有 副作用 ， 而 且 需 要 计算 两 次 ， 一 次 进行 测试 ， 另 一 
次 则 生成 值 。 

假定 有 下 列 定 义 : 


#define tempfile(dir) #dir "%s" 











宏 调用 tempfile(/usr/tmp) 将 生成 


"/usr/tmp" "%s" 

随后 ， 该 结果 将 被 连接 为 一 个 单个 的 字符 串 。 给 定 下 列 定义 : 

#define cat(x, y) x ## y 

那么 ， 宏 调用 cat(var, 123) 将 生成 var123。 但 是 ， 宏 调用 cat(cat(1,2),3) 
ie 义 : 棒 阻 止 了 外 层 调用 的 参数 的 扩展 。 因 此 ， 它 将 生成 下 列 记号 
cat ( 1 2 )3 

并 且 ，)3 (不 是 一 个 合法 的 记号 ， 它 由 第 一 个 参数 的 最 后 一 个 记号 与 第 


Mo 号 连接 而 成 。 如 果 再 引入 第 二 层 的 宏 定义 ， 如 下 
示 : 





#define xcat(x, y) cat(x,y) 


我 们 就 可 以 得 到 正确 的 结果 。xcat(xcat(1, 2), 3) 将 生成 123, LA xcat É 
WIT HE 不 包含 检 运 算 符 。 


类 似 地 ，ABSDIFF(ABSDIFF(a,b),c) 将 生成 所 期 望 的 经 完全 扩展 后 的 结 
果 。 


A.12.4 文件 包含 

下 列 形式 的 控制 指令 : 

#include < 文件 名 > 

将 把 该 行 奉 换 为 文件 名 指定 的 文件 的 内 容 。 文 件 名 不 能 包含 > 或 换行 


符 。 如 果 文 件 名 中 包含 字 符 "、'、\、 或 J， 则 其 行为 没有 定义 。 预 处 理 
pe ere eet 查 找 的 位 置 与 具体 的 实现 相 








类 似 地 ， 下 列 形式 的 控制 指令 : 
#include "文件 名 " 


首先 从 源 文 件 的 位 置 开始 搜索 指定 文件 (搜索 过 程 与 具体 的 实现 相关 )， 
如 果 没 有 找到 指 定 的 文件 ， 则 按照 第 一 种 定义 的 方式 处 理 。 如 果 文 件 
名 中 包含 字符 '、\、 或 入， 其 结果 仍然 是 没有 定义 的 ， 但 可 以 使 用 字符 
> 

最 后 ， 下 列 形式 的 指令 行 : 


#include 记号 序列 同上 述 两 种 情况 都 不 同 ， 它 将 按照 扩展 普通 文本 的 方 
式 扩 展 记 号 序列 进行 解释 。 记 号 序列 必 


须 被 解释 为 <.…> 或 "…" 两 种 形式 之 一 ， 然 后 再 按照 上 述 方式 进行 相应 的 
处 理 。 











#include XA URE. 
A.12.5 条 件 编译 


对 一 个 程序 的 茶 些 部 分 可 以 进行 条 件 编 详 ， 条 件 纺 译 的 语法 形式 如 下 : 


预 处 理 器 条 件 : 

站 行文 本 elif 部 分 opt else 部 分 opt #endif if 行 : 
#if 常量 表达 式 

#ifdef 标识 符 

#ifndef 标识 符 

elif 部 分 : 

elif 行 文本 elif 部 分 opt elif 行 : 
#elif 常量 表达 式 

else 部 分 : 

else {7 文本 

else 47: 

#else 


其 中 ， 每 个 条 件 编译 指令 (直行 、elif 行 、else 行 以 及 #endif) 在 程序 中 均 
单独 占 一 行 。 预 处 理 右 依次 对 #f 以 及 后 续 的 #elif 行 中 的 常量 表达 式 进 
行 计算 ， 下 到 发 现 共 个 指令 的 党 量 表 达 式 为 非 0 值 为 止 ， 这 时 将 放弃 
值 为 0 的 指令 行 后 面 的 文本 。 常 量 表达 式 不 为 0 Hif 和 #elif 指令 之 后 
的 文本 将 按照 其 它 普 通 程 序 代 码 一 样 进行 编译 。 在 这 里 ，" 文 本 "是 指 任 
何 不 属于 条 件 编译 指令 结构 的 程序 代码 ， 它 可 以 包含 预 处 理 指令 ， 也 
可 以 为 空 。 一 旦 预 处 理 器 发 现 茶 个 #f 或 #elif 条 件 编译 指令 中 的 常量 
达 式 的 值 不 为 0， 并 选择 其 后 的 文本 供 以 后 的 编译 阶段 使 用 时 ， 后 续 的 
#elif 和 #else 条 件 编 译 指令 及 相应 的 文本 将 被 放弃 。 如 果 所 有 FY ERKA 
式 的 值 都 为 0， 并 且 该 条 件 编译 指令 链 中 包含 一 条 #else 指令 。 则 将 选择 
Helse 指 令 之 后 的 文本 。 除 了 对 条 件 编译 指令 的 馈 套 进行 检查 之 外 ， 条 
件 编译 指令 的 无 效 分 文 ( 即 条 件 值 为 假 的 分 支 ) 控 制 的 文本 部 将 被 忽略 。 


#if 和 和 #elif HIN Hi BAIA TOR PUTIDA NASR. IFA, FEA PosK 








的 表达 式 : 
defined 标识 符 或 
Defined( 标 识 符 ) 


都 将 在 执行 宏 扫 描 之 前 进行 殖 换 ， 如 果 该 标识 符 在 预 处 理 融 中 已 经 定 
义 ， 则 用 1 替换 它 ， 否 

则 ， 用 0 蔡 换 。 预 处 理 器 进行 宏 扩 展 之 后 仍然 存在 的 任何 标识 符 都 将 用 
0 来 蔡 换 。 最 后 ， 每 

个 整 型 第 量 都 被 预 处 理 器 认为 其 后 面 跟 有 后 级 L， 以 便 把 所 有 的 算术 运 
算 都 当 作 是 在 长 整 型 或 无 符号 长 整 型 的 操作 数 之 间 进 行 的 运算 。 
进行 上 述 处 理 之 后 的 常量 表达 式 ( 参 见 A719 ” 节 ) 满 足下 列 限制 条 件 : 
它 必 须 是 整 型 ， 并 且 其 中 不 包含 sizeof、 强 制 类 型 转换 运算 符 或 枚 举 常 


HÆ o 


/ 





下 列 控制 指令 : 

#ifdef 标识 将 

#ifndef 标识 符 分 别 等 价 于 : 
#if defined 标识 符 

#if !defined 标识 符 


说 明 :#elif 是 ANSI 中 新 引入 的 条 件 编译 指令 ， 但 此 前 它 已 经 在 某 些 预 处 
理 器 中 实现 了 。defined 预 处 理 器 运算 符 也 是 ANSI 中 新 引入 的 特征 。 


A.12.6 行 控制 
为 了 便于 其 它 预 处 理 器 生成 C 语言 程序 ， 下 列 形式 的 指令 行 : 
#line 常量 "文件 名 " 


#line 常量 将 使 编译 器 认为 (出 于 错误 诊断 的 目的 ): 下 一 行 源 代码 的 行 号 
古 以 十 进 制 整 型 常量 的 形式 给 


出 的 ， 并 且 ， 当 前 的 输入 文件 是 由 该 标识 符 命 名 的 。 如 果 缺 少 带 双 引号 
的 文件 名 部 分 ， 则 将 


行 中 的 宏 将 先进 行 扩展 ， 然 后 再 进行 
EIE o 


A.12.7 错误 信息 生成 

下 列 形 式 的 预 处 理 器 控制 指令 : 

#error 记号 序列 opt 

将 使 预 处 理 器 打印 包含 该 记号 序列 的 诊断 信息 。 








A.12.8 pragma 


下 列 形式 的 控制 指令 : 
#pragma 记号 序列 opt 


将 使 预 处 理 器 执行 一 个 与 具体 实现 相关 的 操作 。 无 法 识别 的 
pragma( 编 译 指示 ) 将 被 忽略 挥 。 


A.12.9 空 指 令 


下 列 形式 的 预 处 理 器 行 不 执行 任何 操作 : 





# 


A.12.10 预 定义 名 字 


东 些 标识 符 是 预定 义 的 ， 扩 展 后 将 生成 特定 的 信息 。 它 们 同 预 处 理 串 表 
达 式 运算 符 


defined 一 样 ， 不 能 取消 定义 或 重新 进行 定义 。 


LINE 











FILE 

DATE 

TIME 

STDC 

包含 当前 源 文件 行 数 的 十 进 制 常 量 。 包含 正在 被 编译 的 源 文件 名 字 的 
子 符 串 字面 值 。 包含 编译 日 期 的 字符 串 字 面值 ， 其 形式 为 *“ Mmm dd 
yyyy"。 包含 编译 时 间 的 字符 串 字 面值 ， 其 形式 为 ”hh:mm:ss"。 HAR 
量 1。 只 有 在 遵循 标准 的 实现 中 该 标识 符 才 被 定义 为 1。 

说 明 :#error ‘S#pragma 是 ANSI 标准 中 新 引入 的 特征 。 这 些 预 定义 的 预 


处 理 器 宏 也 是 新 引入 的 ， 其 中 的 一 些 宏 先 前 已 经 在 东 些 编译 器 中 实 
现 。 

















A.13 语法 


这 一 部 分 的 内 容 将 简要 概述 本 附录 前 面部 分 中 讲述 的 语法 。 它 们 的 内 容 
完全 相同 ， 但 顺序 有 一 些 调整 。 


本 语法 没有 定义 下 列 终 结 符 : 整 型 常量 、 字 符 常 量 、 浮 反 和 常量、 标识 

人 符 、 字 符 串 和 枚 举 闻 量 。 以 打字 字体 形式 表示 的 单词 和 符号 是 终 往 
符 。 本 语法 可 以 直接 转换 为 目 动 语法 分 析 程 序 生成 器 可 以 接受 的 输 
入 。 除 了 增加 语法 记 写 说 明 产 生 式 中 的 候选 页 外 ， 还 需要 扩展 其 中 的 “ 
one of 结构 ， 并 (根据 语法 分 析 程 序 生成 器 的 规则 ) 复 制 每 个 带 有 opt 符 
号 的 产生 陈 :一 个 带 有 opt 符 写 ， 一 个 没有 opt 符号 。 这 里 还 有 一 个 变 
化 ， 即 删除 了 产生 式 "类 型 定义 名 : 标识 符 "， 这 样 就 使 得 其 中 的 类 型 定 
































义 名 成 为 个 终结 符 。 该 语法 可 被 YACC 语法 分 析 程 序 生成 器 接受 ， 但 
由 于 ifselse 的 眩 义 性 问题 ， 还 存在 一 处 冲突 。 


翻译 单元 

外 部 声明 

翻译 单元 外 部 声明 外 部 声明 : 
KAGEN 声明 


Bal 


ws 
ai 
< 


明说 明 符 opt 声明 符 声明 表 opt 复合 语句 声明 : 


明说 明 符 初始 化 声明 符 表 opt; 


= 
ri 


Tt tt Ht Tt N 


X 


声明 表 声明 
声明 说 明 符 : 


存储 类 说 明 符 声明 说 明 符 opt 类 型 说 明 符 声明 说 明 符 opt 类 型 限定 符 
WW >> ete 
声明 说 明 符 opt 


存储 类 说 明 符 :one of 
auto register static extern tyedef 
类 型 说 明 符 :one of 


void char short int long float double signed unsigned 结构 或 联合 说 明 符 枚 
举 说 明 符 类 型 定义 名 


类 型 限定 符 :one of 

const volatile 

结构 或 联合 说 明 符 : 

结构 或 联合 标识 符 opt {结构 声明 表 } 
结构 或 联合 标识 符 结构 或 联合 :one of 
struct union 

结构 声明 表 : 

结构 声明 

结构 声明 表 结构 声明 初始 化 声明 符 表 
初始 化 声明 符 

初始 化 声明 符 表 , 初始 化 声明 符 初始 化 声明 符 : 


声明 符 声明 符 = 初 始 化 符 


结构 声明 : 
说 明 符 限定 符 表 结构 声明 符 表 ; 说 明 符 限 定 符 表 : 
类 型 说 明 符 说 明 符 限定 符 表 opt 


类 型 限定 符 说 明 符 限定 符 表 opt 

结构 声明 符 表 : 结构 声明 符 

结构 声明 符 表 , 结构 声明 符 结构 声明 符 : 
声明 符 

声明 符 opt: 常量 表达 式 牧 举 说 明 符 
enum 标识 符 opt { 枚 举 符 表 } enum 标识 符 
枚 举 符 表 : 

枚 举 符 

枚 举 符 表 , 枚 举 符 枚 举 符 

标识 符 标识 符 = 常 量 表达 式 

声明 符 

指针 opt 直接 声明 符 直接 声明 符 : 
标识 符 


(声明 符 ) 直接 声明 符 [常量 表达 式 ] 直接 声明 符 (形式 参数 类 型 表 ) 直接 声 
明 符 ( 标 识 符 表 opt) 


指针 : 

* 类 型 限定 符 表 opt 

* 类 型 限定 符 表 opt 指针 类 型 限定 符 表 : 
类 型 限定 符 

类 型 限定 符 表 类 型 限定 符 


形式 参数 类 型 表 : 

形式 参数 表 形式 参数 表 , .… 

形式 参数 表 : 

形式 参数 表 声 明 形式 参数 表 , 形式 参数 声明 
形式 参数 声明 : 声明 说 明 符 声明 符 
声明 说 明 符 抽象 声明 符 opt 

标识 符 表 : 

标识 符 

标识 符 表 , 标识 符 初 值 : 

赋值 表达 式 

{ 初 值 表 } 

{ 初 值 表 , } 

初 值 表 : 

初 值 

初 值 表 , 初 值 类 型 名 : 

说 明 符 限定 符 表 抽象 声明 符 opt 

抽象 声明 符 : 指针 

指针 opt 直接 抽象 声明 符 直接 抽象 声明 符 : 
(抽象 声明 符 ) 

直接 抽象 声明 符 opt [常量 表达 式 ] 








直接 抽象 声明 符 opt (形式 参数 类 型 表 opt) 
类 型 定义 名 : 


标识 符 


Aa 
带 标 号 语句 表达 式 语句 复合 语句 选择 语句 循环 语句 跳 转 语句 
带 标号 语句 : 
标识 符 : 语句 
case 常量 表达 式 语句 
dafault: 语句 表达 式 语句 ; 
表达 式 opt 
AIA 
{ 声 明 表 opt 语句 表 opt} 
语句 表 : 
语句 
语句 表 语句 选择 语句 : 
if (KAN) 语句 
if (表达 式 ) 语句 else 语句 
switch (表达 式 ) 语句 循环 语句 
while (表达 式 ) 语句 
do 语句 while (表达 式 ); 
for (KAR opt; IAT opt; 表达 式 opt) 语句 跳 转 语句 : 
goto 标识 符 ; continue; 


break; 


return 表达 式 opt; 

表达 式 : 

赋值 表达 式 

表达 式 , MARRA 赋值 表达 式 : 

条 件 表达 式 

一 元 表达 式 赋值 运算 符 赋值 表达 式 赋值 运算 符 :one of 


= *= /= %= += e= <<= >>= &= A= |= 


条 件 表达 式 : 
逻辑 或 表达 式 或 表达 式 ? 表 达 式 :条 件 表达 式 
常量 表达 式 : 


条 件 表达 式 逻辑 或 表达 式 : 

逻辑 与 表达 式 E ERRIA TU |e A SG EIA TL 
逻辑 与 表达 式 

接 位 或 表达 式 逻辑 与 表达 式 && 按 位 或 表达 式 
按 位 或 表达 式 : 按 位 寞 或 表达 式 

按 位 或 表达 式 | 按 位 异 或 表达 式 接 位 异 或 表达 式 : 
按 位 与 表达 式 接 位 异 或 表达 式 ^ 按 位 与 表达 式 
按 位 与 表达 式 : 相等 类 表达 式 

按 位 与 表达 式 & 相 等 类 表达 式 相等 类 表达 式 : 





关系 表达 式 
相等 类 表达 式 == 关 系 表 达 式 相等 类 表达 式 != 关 系 表达 式 
关系 表达 式 : 


移 位 表达 式 关系 表达 式 < 移 位 表达 式 关系 表达 式 > 移 位 表达 式 关系 表达 
式 <= 移 位 表达 式 关系 表达 式 >= 移 位 表达 式 


移 位 表达 式 

加 法 类 表达 式 移 位 表达 式 << 加 法 类 表达 式 移 位 表达 式 >> 加 法 类 表达 式 
加 法 类 表达 式 : 乘法 类 表达 式 

加 法 类 表达 式 + 乘 法 类 表达 式 加 法 类 表达 式 . 乘 法 类 表达 式 

乘法 类 表达 式 : 强制 类 型 转换 表达 式 类 表达 式 * 强 制 类 型 转换 表达 式 
> 
了 











强制 类 型 转换 表达 式 : 一 元 表达 式 

(类 型 名 ) 强 制 类 型 转换 表达 式 一 元 表达 式 : 
后 弘一 元 式 

++ 一 元 表达 式 

“一 元 表达 式 一 元 运算 符 强制 类 型 转换 表达 式 


sizeof 一 元 表达 式 
sizeof( 类 型 名 ) 

一 元 运算 符 :one of 
Be ten! 
HARAR: 


初等 表达 式 后 缀 表达 式 [表达 式 ] 后 级 表达 式 (参数 表达 式 表 opt) FAE 
达 式 .标识 符 后 绥 表 达 式 > 标识 符 后 级 表达 式 ++ 


后 组 表 达 式 .。 初等 表达 式 : 
标识 符 常量 字符 串 (表达 式 ) 

参数 表达 式 表 : 赋值 表达 式 

参数 表达 式 表 , 赋值 表达 式 常量 : 

整 型 常量 字符 常量 浮 点 常量 枚 举 常量 

下 列 预 处 理 器 语法 总 结 了 控制 指令 的 结构 ， 但 不 适合 于 机 械 化 的 语法 分 
析 。 其 中 包含 符 号 "文本 "( 即 通常 的 程序 文本 )、 非 条 件 预 处 理 器 控制 指 
令 或 完整 的 预 处 理 器 条 件 结构 。 

控制 指令 : 


=define 标识 符 记号 序列 

















=define 标识 符 ( 标 识 符 表 opb 记号 序列 


#undef 标识 符 

#include < 文件 名 > 

#include "文件 名 " 

#include 记号 序列 

#line 常量 "文件 名 " 

#line 常量 

#error 记号 序列 。 

#pragma 记号 序列 。 

# 

预 处 理 嚣 条件 指令 预 处 理 器 条 件 指令 : 
if ÍT 文本 elif 部 分 opt else 部 分 opt #endif if 行 : 
#if 常量 表达 式 

#ifdef 标识 符 

#ifndef 标识 符 

elif 部 分 : 

elif 行 文本 elif 部 分 opt elif 行 : 

#elif 常量 表达 式 

else 部 分 : 

else 行 文本 


else 行 : 


#else 


附录 B 标准 库 


本 附录 总 结 了 ANSI 标准 定义 的 函数 库 。 标 准 库 不 是 C 语言 本 身 的 构成 
部 分 ， 但 是 文 持 标准 C 的 实现 会 提供 该 函数 库 中 的 函数 声明 、 类 型 以 
及 宏 定 义 。 在 这 部 分 内 容 中 ， 我 们 省 略 了 一 些 使 用 比较 受 限 的 函数 以 
及 一 些 可 以 通过 其 它 函 数 简单 合成 的 函数 ， 也 省 略 了 多 字 市 字 符 的 内 
容 ， 同 时 ， 也 不 准备 讨论 与 区 域 相关 的 一 些 属性 ， 也 就 星 与 本 地 语言 、 
国籍 或 文化 相 关 的 属性 。 


标准 库 中 的 函数 ， 类 型 以 及 宏 分 别 在 下 面 的 标准 头 文件 中 定义 : 








可 以 通过 下 列 方式 访问 头 文 件 : 
#include < 头 文 件 > 
头 文 件 的 包含 顺序 是 任意 的 ， 并 可 包含 任意 多 次 。 头 文件 必须 被 包含 在 








任何 外 部 声明 或 定义 之 外 ， 并 且 ， 必 须 在 使 用 头 文件 中 的 任何 声明 之 
前 包含 头 文件 。 头 文件 不 一 定 是 一 个 源 文件 。 

以 下 划 线 开头 的 外 部 标识 符 保 留 给 标准 库 使 用 ， 同 时 ， 其 它 所 有 以 一 个 
下 划 线 和 一 个 大 与 字母 开头 的 标识 符 以 及 以 两 个 下 划 线 开头 的 标识 符 
也 都 保留 给 标准 库 使 用 。 


B.1 输入 与 输出 :<stdio.h> 








头 文件 <stdio.h> 中 定义 的 输入 和 输出 函数 、 类 型 以 及 宏 的 数目 几乎 占 整 
个 标准 库 的 三 分 之 一 。 


流 (stream) 是 与 磁盘 或 其 它 外 围 设 备 关 联 的 数据 的 源 或 目的 地 。 尽 管 在 
某 些 系统 中 (如 在 著名 的 UNIX 系统 中 )， 文 本 流 和 二 进 制 流 是 相同 的 ， 
但 标准 库 仍然 提供 了 这 两 种 类 型 的 流 。 文本 流 是 由 文本 行 组 成 的 序 
列 ， 每 一 行 包含 0 个 或 多 个 字符 ， 并 以 \n' 结尾 。 在 某 些 环境 中 ， 可 能 
需要 将 文本 流转 换 为 其 它 表 示 形 式 ( 例 如 把 澡 映 射 成 回 车 符 和 换行 符 )， 
或 从 其 它 表 示 形式 转换 为 文本 流 。 二 进 制 流 是 由 未 经 处 理 的 字 节 构成 
的 序列 ， 这 些 字 节 记 录 着 内 部 数据 ， 并 具有 下 列 性 质 :如 果 在 同一 系统 
eee 然后 再 读 取 该 二 进 制 流 ， 则 读 出 和 写 入 的 内 容 完 
HEJ. 

打开 一 个 流 ， 将 把 该 流 与 一 个 文件 或 设备 连接 起 来 ， 关 闭 流 将 断 开 这 种 
连接 ， 打 开 一 个 文件 将 返回 一 个 指 癌 FILE 类 型 对 象 的 指针 ， 该 指针 记 
录 了 控制 该 流 的 所 有 必要 信息 ， 在 不 引 起 皮 义 的 情况 下 ， 我 们 在 下 文 
中 将 不 再 区 分 "文件 指针 "和 " 流 "。 


程序 开始 执行 时 ，stdin、stdout 和 stderr 这 3 个 流 已 经 处 于 打开 状态 。 

















B.1.1 文件 操作 


下 列 函 数 用 于 处 理 与 文件 有 关 的 操作 。 其 中 ， 类 型 size t 是 由 运算 符 
sizeof 生成 的 无 符号 整 型 。 


FILE *fopen(const char *filename, const char *mode) 


fopen 函数 打开 filename 指定 的 文件 ， 并 返回 一 个 与 之 相关 联 的 流 。 如 
果 打 开 操 作 失 败 ， 则 返回 NULL. 


访问 模式 mode 可 以 为 下 列 合 法 值 之 一 : 


ae 打开 文本 文件 用 于 读 

"w" 创建 文本 文件 用 于 写 ， 并 删除 已 存在 的 内 容 (如 果 有 的 话 ) 

"a" 退 加 ;打开 或 创建 文本 文件 ， 并 回 文 件 末尾 退 加 内 容 

"+" 打开 文本 文件 用 于 更 新 ( 即 读 和 写 ) 

"wt" 创建 文本 文件 用 于 更 新 ， 并 删除 已 存在 的 内 容 (如 果 有 的 话 ) 
退 加 ;打开 或 创建 文本 文件 用 于 更 新 ， 写 文件 时 追加 到 文件 


后 3 种 方式 (更 新 方式 ) 允 许 对 同一 文件 进行 读 和 写 。 在 读 和 写 的 交叉 过 
程 中 ， 必 须 调 用 fflush 函数 或 文件 定位 函数 。 如 果 在 上 述 访问 模式 之 后 
再 加 上 b, Wn“ rb"ik“ w+b" 等 ， 则 表示 对 二 进 制 文件 进行 操作 。 文 件 名 
filename 限定 最 多 为 FILENAME MAX 个 字符 。 一 次 最 多 可 打开 
FOPEN_MAX 个 文件 。 





FILE *freopen(const char *filename, const char *mode, FILE *stream) 
freopen 函数 以 mode 指定 的 模式 打开 filename 指定 的 文件 ， 并 将 该 文件 
关联 到 

stream 指定 的 流 。 它 返回 stream; 知 出 错 则 返回 NULL. Freopen 函数 一 
般 用 于 改变 与 


stdin、stdout 和 stderr 相关 联 的 文件 。 


int fflush(FILE *stream) 


对 输出 流 来 说 ，fflush 函数 将 已 写 到 缓冲 区 但 尚未 写 入 文件 的 所 有 数据 
写 到 文件 中 。 对 输入 流 来 说 ， 其 结果 是 未 定义 的 。 如 果 在 写 的 过 程 中 
发 生 错 误 ， 则 返回 EOF, FURE 0。fflush(NULL) 将 清洗 所 有 的 输出 
流 。 

int fclose(FILE *stream) 

fclose 函数 将 所 有 未 写 入 的 数据 写 入 stream P, ERAM KENAR 
读 输 入 数据 ， 并 释放 自动 分 配 的 全 部 缓冲 区 ， 最 后 关闭 流 。 若 出 错 则 
返回 EOF, AIK 0。 


int remove(const char *filename) 


remove 函数 删除 filename 指定 的 文件 ， 这 样 ， 后 续 试 图 打开 该 文件 的 
操作 将 失败 。 如 果 有 删除 操作 失败 ， 则 返回 一 个 非 0 值 。 


int rename(const char *oldname, const char *newname) rename 国 数 修改 文 


件 的 名 字 。 如 果 操 作 失 败 ， 则 返回 一 个 非 0 值 。 

FILE *tmpfile(void) 

tmpfile 函数 以 模式 "wb+" 创 建 一 个 临时 文件 ， 访 文件 在 被 关闭 或 程序 正 
第 结 束 时 将 被 自动 删除 。 如 果 创 建 操作 成 功 ， 该 函数 返回 一 个 流 ; 如 果 
创建 文件 失败 ， 则 返回 NULL。 


char *tmpnam(char s[L_tmpnam]) 


tmpnam(NULL) 函 数 创建 一 个 与 现 有 文件 名 不 同 的 字符 串 ， 并 返回 一 个 
指向 一 内 部 静态 数组 的 指针 。tmpnam(S) 函 数 把 创建 的 字符 串 保存 到 数 
组 s 中 ， 并 将 它 作 为 函数 值 返回 。s 中 至 少 要 有 工 _ tmpnam 个 字符 的 空 

间 。Tmpnam 函数 在 每 次 被 调用 时 均 生 成 不 同 的 名 字 。 在 程序 执行 的 过 
程 中 ， 最 多 只 能 确保 生成 TMP_MAX 个 不 同 的 名 字 。 注 意 ，tmpnam Pf 
数 只 是 用 于 创建 一 个 名 字 ， 而 不 是 创建 一 个 文件 。 








int setvbuf(FILE *stream, char *buf, int mode, size_t size) 


setvbuf Ph AUF Hill stream 的 缓冲 。 在 执行 读 、 写 以 及 其 它 任何 操作 之 
前 必须 调用 此 函数 。 当 mode 的 值 为 IOFBF 时 ， 将 进行 完全 缓冲 。 当 
mode 的 值 为 IJOLBF 时 ， 将 对 文本 文件 进行 行 缓冲 ， 当 mode 的 值 为 
_IONBF 时 ， 表 示 不 设置 缓冲 。 如 果 buf 的 值 不 是 NULL， 则 setvbuf K 
BCH buf 指 回 的 区 域 作 为 流 的 缓冲 区 ， 人 否则 将 分 配 一 个 绥 冲 区 。size 决 
定 缓冲 区 的 长 度 。 如 果 setvbuf 函数 出 错 ， 则 返回 个 一 非 0 值 。 


void setbuf(FILE *stream, char *buf) 


如 果 buf KA NULL, WS 闭 流 stream 的 缓冲 ;否则 setbuf 函数 等 
F 


(void)setvbuf(stream, buf, _IOFBF, BUFSIZ). 
B.1.2 格式 化 输出 

printf 函数 提供 格式 化 输出 转换 。 

int fprintf(FILE *stream, const char *format, ...) 


fprintf 函数 按照 format 说 明 的 格式 对 输出 进行 转换 ， 并 写 到 stream 流 
中 。 返 回 值 是 实际 写 入 的 字符 数 。 知 出 错 则 返回 一 个 负 值 。 

格式 串 由 两 种 类 型 的 对 象 组 成 :普通 字符 (将 被 复制 到 输出 流 中 ) 与 转换 说 
明 ( 分 别 决 定 下 一 后 续 参 数 的 转换 和 打印 )。 每 个 转换 说 明 均 以 字符 % 开 
头 ， 以 转换 字符 绪 束 。 在 % 与 转换 字符 之 间 可 以 依次 包括 下 列 内 容 : 


标志 (可 以 以 任意 顺序 出 现 )， 用 于 修改 转换 说 明 








指定 被 转换 的 参数 在 其 字段 内 左 对 齐 
指定 在 输出 的 数 前 面 加 上 正 负 号 
空格 如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 
对 于 数值 转换 ， 当 输出 长 度 小 于 字段 宽度 时 ， 添 加 前 导 0 进行 





指定 另 一 种 输出 形式 。 如 果 为 o 转换 ， 则 第 一 个 数字 
WE 如 果 为 x 或 X 转换 ， 则 指定 在 输出 的 非 0 值 前 加 Ox BK 0X; 对 于 
e、E、f、g 或 G 转换 ， 指 定 输出 总 包括 一 个 小 数 点 ;对 于 g 或 G 转换 ， 
旨 定 输出 值 尾 部 无 意义 的 0 将 被 保留 


一 个 数值 ， 用 于 指定 最 小 字段 宽度 。 转 换 后 的 参数 输出 宽度 至 
少 要 达到 这 个 数值 。 如 果 参 数 的 字符 数 小 于 此 数值 ， 则 在 参数 宽 边 (如 
果 要 求 左 对 齐 的 话 则 为 右边 ) 填 


充 一 些 字 符 。 填 充 字 符 通 前 为 空 阁 ， 但 是 ， 如 宁 设 置 了 0 填充 标志 ， 则 
填充 字符 为 0。 











， 用 于 分 隔 字段 宽度 和 精度 。 


表示 精度 的 数 。 对 于 字符 串 ， 它 指定 打印 的 字符 的 最 大 个 数 ; 
对 于 e、 玉 或 f 转 换 ， 它 指定 打印 的 小 数 点 后 的 数字 位 数 ;对 于 gg 或 G 转 
换 ， 它 指定 打印 的 有 效 数 字 位 数 ; 


ae re eae Sree ae eee 
宽度 )。 


KEMI h 1L. h 表示 将 相应 的 参数 按 short 或 unsigned 


short 类 型 输 





出 。1 表 示 将 相应 的 参数 按 long 或 unsigned long 类 型 输出 ;L 表示 将 相应 
的 参 数 按 long double 类 型 输出 。 


宽度 和 精度 中 的 任何 一 个 或 两 者 都 可 以 用 * 指 定 ， 这 种 情况 下 ， 该 值 将 
通过 转换 下 一 个 参数 计 算得 到 (下 一 个 参数 必须 为 int 类 型 )。 


表 Bel 中 列 出 了 这 些 转换 字符 及 其 意义 。 如 果 % 后 面 的 字符 不 是 转换 字 
从 ， 则 其 行为 没有 定义。 


表 B.1 printf 函数 的 转换 字符 











转换 
字符 参数 类 型 ;转换 结 


int 有 符号 十 进 制 表示 
unsigned int; 无 符号 八进制 表示 


“ unsigned int; 无 符号 十 六 进 制 表示 (没有 前 导 0x BOX), WIRE 
0x， 则 使 用 abcdef， 如 果 是 0X， 则 使 用 ABCDEF 


int; 无 符号 十 进 制 表 示 
int; 转 换 为 unsigned char 类 型 后 为 一 个 字符 


*; 打 印字 符 串 中 的 字符 ， 直 到 过 到 "0 或 已 打印 了 由 精度 指定 的 
FATE 


:double; 形 式 为 ["]mmnm.ddd 的 十 进 制 表示 ， 其 中 ，d 的 数目 由 精度 确 
确定 ， 默 认 精度 为 6。 精度 为 0 时 不 输 出 小 数 点 


double; 形 式 为 ["]m.dddddd e +xx 或 [.]m.dddddd E +xx。d 的 数目 由 
精度 确定 ， 默 认 精 度 为 6。 精度 为 0 时 不 输出 小 数 点 


ss double; 当 指数 小 于 .4 或 大 于 等 于 精度 时 ， 采 用 %e 或 %E 的 格式 ， 
否则 采用 %f 的 格式 。 尾 部 的 0 和 小 数 点 不 打印 


r void *; 打 印 指针 值 (具体 表示 方式 与 实现 有 关 ) 











int *; 到 目前 为 止 ， 此 printf 调用 输出 的 字符 的 数目 将 被 号 入 到 相应 
参数 中 。 不 进行 参数 转换 





不 进行 参数 转换 ;打印 一 个 符号 % 
int printf(const char *format, ...) printf(...) 函 数 等 价 于 fprintf(stdout, ...). 
int sprintf(char *s, const char *format, ...) 


sprintf 函数 与 printf 函数 基本 相同 ， 但 其 输出 将 被 写 入 到 字符 串 s 中 ， 
并 以 \0' 结束 。s 必须 足够 大 ， 以 足够 容纳 下 输出 结果 。 该 函数 返回 实际 
输出 的 字符 数 ， 不 包括 \0'。 


int vprintf(const char *format, va_list arg) 


int vfprintf(FILE *stream, const char *format, va_list arg) int vsprintf(char 
*s, const char *format, va_list arg) 


vprintf. vfprintf. vsprintf 这 3 个 函数 分 别 与 对 应 的 printf 函数 等 价 ， 但 
它 们 用 arg RE TIRSAK. arg HE va_start 初始 化 ， 也 可 能 由 
va_arg 调用 初始 化 。 详细 信息 参见 B.7 节 中 对 <stdarg.h> 头 文件 的 讨 


论 。 


B.1.3 格式 化 输入 
scanf 函数 处 理 格式 化 输入 转换 。 
int fscanf(FILE *stream, const char *format, ...) 


fscanf 函数 根据 格式 串 format 从 流 stream 中 读 取 输入 ， 并 把 转换 后 的 值 
赋值 给 后 续 各 个 参数 ， 其 中 的 每 个 参数 都 必须 是 一 个 指针 。 当 格式 串 
format 用 完 时 ， 函 数 返 回 。 如 果 到 达 文 件 的 末尾 或 在 转换 输入 前 出 错 ， 
该 函数 返回 EOF; 否 则 ， 返 回 实际 被 转换 并 赋值 的 输入 页 的 数目 。 


格式 串 format 通 第 包括 转换 说 明 ， 它 用 于 指导 对 输入 进行 解释 。 格 式 字 
符 串 中 可 以 包 含 下 列 页 目 : 


空格 或 制 表 符 


普通 字符 (% 除 外 )， 它 将 与 输入 流 中 下 一 个 非 空白 字符 进行 匹 
配 


转换 说 明 ， 由 一 个 %、 一 个 赋值 屏蔽 字符 *( 可 选 )、 一 个 指定 最 
大 字段 宽度 的 数 (可 选 )、 一 个 指定 目标 字段 宽度 的 字符 h、1 或 ”LL)( 可 
选 ) 以 及 一 个 转换 字符 组 成 。 


转换 说 明 决 定 了 下 一 个 输入 字段 的 转换 方式 。 通 常 结 采 将 被 保存 在 由 对 
WEBS Ae 量 中 。 但 是 ， 如 果 转 换 说 明 中 包含 赋值 屏蔽 字符 *， 例 
如 %*s， 则 将 跳 过 对 应 的 输入 字段 ， 并 不 进行 赋值 。 输 入 字段 时 一 个 由 
非 空 白 符 字符 组 成 的 字符 串 ， 当 过 到 下 一 个 空白 符 或 达到 最 大 字段 宽 
度 (如 果 有 的 话 ) 时 ， 对 当前 输入 字段 的 读 取 结 束 。 这 意味 着 ，scanf 函数 
可 以 跨越 行 的 边界 读 取 输入 ， 因 为 换行 符 也 是 空白 符 (空白 符 包 括 空 
Ae. RRE MURRE 换行 待 、 回 车 符 和 换 页 符 )。 


转换 字符 说 明了 对 输入 字段 的 解释 方式 。 对 应 的 参数 必须 是 指针 。 合 法 
的 转换 字符 如 表 


Be2 所 示 。 


如 果 参 数 是 指向 short 类 型 而 非 int 类 型 的 指针 ， 则 在 转换 字符 d i 
n、o0、uUu 和 x 之 前 可 以 加 上 前 级 h。 如 果 参 数 是 指向 long 类 型 的 指针 ， 








则 在 这 几 个 转换 字符 前 可 以 加 上 字 母 1。 如 果 参 数 是 指 问 double 类 型 而 

JE float 类 型 的 指针 ， 则 在 转换 字符 e、f 和 g 前 可 以 加 上 字母 1。 如 果 

long double 类 型 的 指针 ， 则 在 转换 字符 e、f 和 g 前 可 以 加 
EEL. 


K B*2 scanf 函数 的 转换 宇 符 





转换 





字符 输入 数据 ;参数 类 型 
4 十进制 整 数 ;int * 


整 型 数 ;int*。 该 整 型 数 可 以 是 八进制 (以 0 开头 ) 或 十 六 进 制 (以 Ox 
或 0X 开头 ) 


八进制 整 型 数 (可 以 带 或 不 带 前 导 0);int * 

无 符号 十 进 制 整 型 数 ;unsigned int * 

十 六 进 制 整 型 数 (可 以 带 或 不 带 前 导 Ox BK OX);int * 
”字符 ;char*， 按 照 字 段 宽度 的 大 小 把 读 取 的 字符 保存 到 制定 的 数组 
中 ， 不 增加 M0' 字 段 宽度 的 默认 值 为 1。 在 这 种 情况 下 ， 读 取 输入 时 将 不 
跳 过 空白 符 。 如 果 需 要 读 入 下 一 个 非 空 日 符 ， 可 以 使 用 %1s 

由 非 空 日 符 组 成 的 字符 串 (不 包含 引号 );char *， 它 指 辣 一 个 字符 数 


组 ， 该 字符 数组 必须 有 足够 空间 ， 以 保存 该 字符 串 以 及 在 尾部 添加 
的 \0' 字 符 








浮 点 数 ，float *. Float 类 型 浮 点 数 的 输入 格式 为 :一 个 可 选 的 正 负 与、 一 
个 可 能 包含 小 数 点 的 数字 串 ， 


= 





可 选 的 指数 字段 (字母 e 或 EE 后 跟 一 个 可 能 带 正 负 号 的 整 型 数 ) 
”printf("%p") 函 数 调 用 打印 的 指针 值 ;void * 


将 到 目前 为 止 该 函数 调用 读 取 的 字符 数 写 入 对 应 的 参数 中 ;int*。 音 
读 取 输 入 字符 。 不 增加 已 转换 的 页 目 计数 


-与 方 括号 中 的 字符 集合 匹配 的 输入 字符 中 最 长 的 非 空 字符 串 ;char 
*。 末 尾 将 添加 0'。[].] 表 示 集合 中 包含 字符 “了 


“与 方 括号 中 的 字符 集合 不 匹配 的 输入 字符 中 最 长 的 非 空 字符 
串 ;char *。 末 尾 将 添加 \0'。[ 和 ..….] 表 示 集合 中 不 包含 字符 “了 


pals 
TA 


表示 “%"， 不 进行 赋值 
int scanf(const char *format, ...) scanf(...) 函 数 与 fscanf(stdin, ...) 相 同 。 
int sscanf(const char *s, const char *format, ...) 


sscanf(s, ...) FXG scanf(.…) 等 价 ， 所 不 同 的 是 ， 前 者 的 输入 字符 来 产 于 


字符 FB So 
B.1.4 字符 输入 /输出 函数 


int fgetc(FILE *stream) 


fqetc 函数 返回 stream 流 的 下 一 个 字符 ， 返 回 类 型 为 unsigned char( 被 转 
换 为 int 


类 型 )。 如 果 到 达 文 件 末尾 或 发 生 错误 ， 则 返回 EOF. 





char *fgets(char *s, int n, FILE *stream) 


fgets 函数 最 多 将 下 ne1 个 字符 读 入 到 数组 s 中 。 当 遇 到 换行 符 时 ， 把 换 
行 符 读 入 到 数组 s 中 ， 读 取 过 程 终止 。 数 组 s 以 \0' 结 尾 。fgets 函数 返 
回 数组 s。 如 果 到 达 文 件 的 末尾 或 发 生 错误 ， 则 返回 NULL. 


int fputc(int c, FILE *stream) 


fputc 函数 把 字符 c( 转 换 为 unsigned char 类 型 ) 输 出 到 流 stream 中 。 它 返 
回 写 入 的 字符 ， 大 出 错 则 返回 EOF. 


int fputs(const char *s, FILE *stream) 


fputs 函数 把 字符 串 s( 不 包含 字符 \n') 输 出 到 流 Btream 中 ; 它 返 回 一 个 非 
负 值 ， 知 出错 则 返回 EOF. 


int getc(FILE *stream) 


gete 函数 等 价 于 fgetc， 所 不 同 的 是 ， 当 gete 函数 定义 为 宏 时 ， 它 可 能 
多 次 计算 


stream 的 值 。 
int getchar(void) 


getchar 函数 等 价 于 getc(stdin). 


char *gets(char *s) 

gets 函数 把 下 一 个 输入 行 读 入 到 数组 s 中 ， 并 把 末尾 的 换行 符 替 换 为 字 
符 \0'。 它 返回 数组 s， 如 果 到 达 文 件 的 末尾 或 发 生 错误 ， 则 返回 
NULL. 

int putc(int c, FILE *stream) 


putc 函数 等 价 于 fputc， 所 不 同 的 是 ， 当 pute 函数 定义 为 宏 时 ， 它 可 能 
多 次 计算 


stream 的 值 。 
int putchar(int c) 
putchar(c) K žr F putc(c stdout). int puts(const char *s) 


puts 函数 把 字符 串 s 和 一 个 换行 符 输出 到 stdout 中 。 如 果 发 生 错 误 ， 则 
返回 EOF; E 则 返回 一 个 非 负 值 。 


int ungetc(int c, FILE *stream) 

ungetc 函数 把 c( 转 换 为 unsigned char 类 型 ) 写 回 到 流 stream H, FAX 
该 流 进行 读 操 作 时 ， 将 返回 该 字符 。 对 每 个 流 只 能 写 回 一 个 字符 ， 且 
此 字符 不 能 是 EOF。ungetc 函数 返回 被 写 回 的 字符 ， 如 果 发 生 错 误 ， 则 
返回 EOF。 

B.1.5 直接 输入 /输出 函数 


size_t fread(void *ptr, size_t size, size_t nobj, FILE *stream) fread 函数 从 流 
stream 中 读 取 最 多 nobj 个 长 度 为 size 的 对 象 ， 并 保存 到 ptr 指向 


的 数组 中 。 它 返回 读 取 的 对 象 数 目 ， 此 返回 值 可 能 小 于 nobj。 必 须 通过 
函数 feof 和 ferror 


获得 结果 执行 状态 。 


size_t fwrite(const void *ptr, size_t size, size_t nobj, FILE *stream) fwrite px 


BUM ptr 指向 的 数组 中 读 取 nobj 个 长 度 为 size 的 对 象 ， 并 输出 到 流 


stream 


它 返 回 输出 的 对 象 数 目 。 如 果 友 生 错 误 ， 返 回 值 会 小 于 nobj 的 


B.1.6 SCTE FE A PR BL 
int fseek(FILE *stream, long offset, int origin) 


fseek 函数 设置 流 stream 的 文件 位 置 ， 后 续 的 读 写 操作 将 从 新 位 置 开 
始 。 对 于 二 进 制 文件 ， 此 位 置 被 设置 为 从 origin 开始 的 第 offset 个 字符 
Ako Origin 的 值 可 以 为 SEEK_SET (文件 开始 处 )、SEEK_CUR( 当 前 位 
置 ) 或 SEEK_END( 文 件 结束 处 )。 对 于 文本 流 ，offset 必须 设置 为 0， 或 
者 是 由 函数 ftell 返回 的 值 (此 时 origin 的 值 必须 是 SEEK_SET)。fseek 函 
数 在 出 错时 返回 一 个 非 0 值 。 


long ftell(FILE *stream) 


ftell 函数 返回 stream 流 的 当前 文件 位 置 ， 出 错时 该 函数 返回 "1L。 
void rewind(FILE *stream) 


rewind(fp) 函 数 等 价 于 语句 fseek(fp, OL, SEEK_SET);clearerr(fp) 的 执行 结 
果 。 


int fgetpos(FILE *stream, fpos_t *ptr) 


fgetpos 函数 把 stream 流 的 当前 位 置 记录 在 *ptr 中 ， 供 随后 的 fsetpos R 
数 调用 使 用 。 知 出 错 则 返回 一 个 非 0 值 。 


int fsetpos(FILE *stream, const fpos_t *ptr) 


fsetpos 函数 将 流 stream 的 当前 位 置 设 置 为 fgetpos 记录 在 *ptr 中 的 位 
eo A hee 则 返回 一 个 非 0 值 。 


B.1.7 错误 处 理 函 数 


当 发 生 错 误 或 到 达 文 件 末尾 时 ， 标 准 库 中 的 许多 函数 都 会 设置 状态 指示 
符 。 这 些 状态 指 示 符 可 被 显 式 地 设置 和 测试 。 另 外 ， 整 型 表达 式 
errmno( 在 <errno.h> 中 声明 ) 可 以 包含 一 个 错误 编写 ， 据 此 可 以 进一步 了 解 
最 近 一 次 出 错 的 信息 。 








void clearerr(FILE *stream) 
clearerr 函数 清除 与 流 stream 相关 的 文件 结束 符 和 错误 指示 符 。 
int feof(FILE *stream) 


如 果 设 置 了 与 stream 流 相 关 的 文件 结束 指示 符 ，feof 函数 将 返回 一 个 非 
0 值 ， 


int ferror(FILE *stream) 


如 果 设 置 了 与 stream 流 相 关 的 错误 指示 符 ，ferror 函数 将 返回 一 个 非 0 
值 。 


void perror(const char *s) 


perror(s) i SCT FI Rt s 以 及 与 errno 中 整 型 值 相应 的 错误 信息 ， 错 误 
le BNA 体内 容 与 具体 的 实现 有 关 。 该 函数 的 功能 类 似 于 执行 下 列 语 


fprintf(stderr, "%s: %s\n", s, "error message"); 


ARK strerror 的 信息 ， 参 见 B.3 节 中 的 介绍 。 

B.2 字符 类 别 测试 :<ctype.h> 

头 文 件 <ctype.h> 中 声明 了 一 些 测 试 字符 的 函数 。 每 个 函数 的 参数 均 为 
int 类 型 ， 参 数 的 值 必 须 是 EOF 或 可 用 unsigned char 类 型 表示 的 字符 ， 
Pa SCE EYY int 类 型 。 如 果 参数 c 满足 指定 的 条 件 ， 则 函数 返回 非 
0 值 (表示 真 )， 否 则 返回 0( 表 示 假 )。 这 些 函 数 包 括 : 


isalnum(c) 函数 isalpha(c)#k isdigit(c) NA 





isalpha(c) 函数 isupper(@ 〇 或 islower(O 为 真 iscntrl(O c 为 控 
制 字符 


isdigit(c) c 为 十 进 制 数字 isgraph(c) c 是 除 空格 外 的 可 打 
印字 符 islower(c) c 是 小 写字 母 isprint(c) c 是 包括 空格 的 
可 打印 字符 

ispunct(c) c 是 除 空格 、 字 母 和 数字 外 的 可 打印 字符 

isspace(c) c 是 空格 、 换 页 符 、 换 行 符 、 回 车 符 、 横 回 制 表 符 或 纵 
HERI 

isupper(c) EINEAN 

isxdigit(c) c 是 十 六 进 制 数 字 


在 7 位 ASCI 字符 集中 ， 可 打印 字符 是 从 0x20( ) 到 0x7E(~) 之 间 的 字 
符 ; 控 制 字符 是 从 0(NUL) 到 0xlF(US) 之 间 的 字符 以 及 字符 0x7F(DEL)。 


另外 ， 下 面 两 个 函数 可 用 于 字母 的 大 小 写 转 换 : int tolower(int 
) 将 c 转换 为 小 写字 母 int toupper(int c) 将 c 转换 为 大 写字 


如 果 c 是 大 写字 母 ， 则 tolower(@ 返 回 相 应 的 小 写字 母 ， 和 否则 返回 c。 如 
Rew) SFE, M toupper(@ 〇 返回 相应 的 大 写字 母 ， 否 则 返回 co 


B.3 字符 串 函 数 :<string.h> 


头 文件 <string.h> 中 定义 了 两 组 字符 串 函 数 。 第 一 组 冰 数 的 名 字 以 str FP 
头 ;第 二 组 函数 的 名 字 以 mem 开头 。 除 函数 memmove 外 ， 其 它 函 数 都 
没有 定义 重 登 对 象 间 的 复制 行为 。 比较 函数 将 把 参数 作为 unsigned char 
类 型 的 数组 看 待 。 


在 下 表 中 ， 变 量 s Alt 的 类 型 为 char *;cs 和 ct 的 类 型 为 const char *;n 的 
类 型 为 size_t;c 的 类 型 为 int( 将 被 转换 为 char 类 型 )。 




















char *strcpy(s,ct) 


将 字符 串 ct( 包 括 \0) 复 制 到 字符 串 s 中 ， 并 返 


P ct 中 最 多 n 个 字符 复制 到 字符 串 s 中 ， 并 
Elso WR ct 中 少 于 mn 个 字符 ， 则 用 \0' 填 充 


将 字符 串 ct 连接 到 s 的 尾部 ， 并 返回 s 


char *strncat(s,cbn)| 将 字符 串 ct 中 最 多 前 n 个 字符 连接 到 字符 串 s 的 尾 


int strcemp(cs,ct) 


int strncmp(cs,ct,n) 


char *strchr(cs,c) 


部 ， 并 以 \0' 结 束 ; 该 函数 返回 s 


比较 字符 串 cs 和 ct; 当 cs<ct 时 ， 返 回 一 个 负数 ; 
当 cs==ct 时， 返回 0; 当 cs>ct 时 ， 返 回 一 个 正 
数 


将 字符 串 cs 中 至 多 前 n 个 字符 与 字符 串 ct 相 比 
Be 


当 cs<ct 时 ， 返 回 一 个 负数 : 当 cs==ct 时 ， 返 回 
0; 当 cs>ct 时 ， 返 回 一 个 正 数 








返回 指 加 字符 c 在 字符 串 cs 中 第 一 次 出 现 的 位 置 的 


指针 ;如 果 cs 中 不 包含 c， 则 该 函数 返回 NULL 





char *strrchr(cs,c) 返回 指 疝 字符 c 在 字符 串 cs 中 最 后 一 次 出 现 的 位 置 





的 指针 ;如 果 cs 中 不 包含 c， 则 该 函数 返回 NULL 


REEE cs 中 包 全 中 的 字符 的 前 级 的 长 并 


返回 字符 串 cs 中 不 包含 ct 中 的 字符 的 前 级 的 长 度 















返回 一 个 指针 ， 它 指 同 字符 串 ct 中 的 任意 字符 第 一 
次 出 现在 字符 串 cs 中 的 位 置 ;如 果 cs 中 没有 与 ct 


相同 的 字符 ， 则 返回 NULL 





char *strstr(cs,ct) 返回 一 个 指针 ， 它 指 癌 字符 串 ct 第 一 次 出 现在 字符 
E cs 中 的 位 置 ;如 果 cs 中 不 包含 字符 串 ct， 则 返 


回 NULL 


返回 字符 串 cs 的 长 度 











char *strerror(n) ”上 退回 一 个 指针 ， 它 指 同 与 错误 编号 n 对 应 的 错误 信 
息 


字符 串 (错误 信息 的 具体 内 容 与 具体 实现 相关 ) 








char *strtok(s,ct) jstrtok 函数 在 s 中 搜索 由 ct 中 的 字符 界定 的 记号 。 





| f 详细 信息 参见 下 面 的 讨论 





对 strtok(s, ct) 进 行 一 可 以 把 字符 串 s 分 成 许多 记号 ， 这 些 记 
号 以 ct 中 的 字符 为 分 界 符 。 第 一 次 调用 时 ，s 为 非 空 。 它 搜索 s， 找 到 
不 包含 ct 中 字符 的 第 一 了 记号 将 s 中 的 下 一 个 字符 替换 为 \0， 并 返 
回 指向 记号 的 指针 。 随 后 ， 每 次 调用 strtok 函数 时 (由 s 的 值 是 否 
NULL 指示 )， 均 返 回 下 一 个 不 包含 ct 中 字符 的 记号 。 当 s 中 没有 这 样 
的 记号 时 ， 返 回 NULL。 每 次 调用 时 字符 串 ct 可 以 不 同 。 


以 mem 开头 的 函数 按照 字符 数组 的 方式 操作 对 象 ， 其 主要 目的 是 提供 
一 个 高 效 的 函数 接口 。 在 下 表 列 出 的 函数 中 ，s 和 t+ 的 类 型 均 为 void 
*， cs 和 ct 的 类 型 均 为 const void *, n 的 类 型 为 size t, c 的 类 型 为 
int( 将 被 转换 为 unsigned char 类 型 )。 














FE ct 中 的 个 字符 拷贝 到 s 中 ， 并 返 


memcpy 相似 ， 所 不 同 的 是 ， 当 对 


= 
= 
= 


时 ， 该 函数 仍 能 正确 执行 


int memcmp(cs,cbn)l 将 cs 的 前 n 个 字符 与 ct 进行 比较 ， 其 返回 值 与 





void 返回 一 个 指针 ， 它 指向 c 在 cs 中 第 一 次 出 现 的 位 
*memchr(cs,c,n) |E. WR 


cs 的 前 n 个 字符 中 找 不 到 匹配 ， 则 返回 NULL 








| | 
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B.4 数学 函数 :<math.h> 


头 文件 <math.h> 中 声明 了 一 些 数学 函数 和 宏 。 


E EDOM 和 ERANGE( 在 头 文件 <error.h> 中 声明 ) 是 两 个 非 0 整 型 常 

量 ， 用 于 指示 函 数 的 定义 域 错 误 和 值 域 错误 ;HUGE_VAL 是 一 个 double 
类 型 的 正 数 。 当 参数 位 于 函数 定义 的 作用 域 之 外 时 ， 就 会 出 现 定义 域 
错误 。 在 发 生 定义 域 错 误 时 ， 全 局 变量 erno 的 值 将 被 设 置 为 EDOM， 
函数 的 返回 值 与 具体 的 实现 相关 。 如 果 函 数 的 结果 不 能 用 double 类 型 
表示 ， 则 会 发 生 值 域 错 误 。 当 结果 上 涪 时 ， 函 数 返回 HUGE_VAL， 并 
带 有 正确 的 正 负 号 ，errpo 的 值 将 被 设置 为 ERANGE。 当 结果 下 溢 时 ， 
函数 返回 0， 而 ermo 是 否 设置 为 ERANGE 要 视 具 体 


的 实现 而 定 。 


在 下 表 中 ，x 和 y 的 类 型 为 double, n 的 类 型 为 int， 所 有 函数 的 返回 值 
的 类 型 均 为 double。 三 角 函 数 的 角度 用 弧度 表示 。 





oo F MEt 
ww | 的 余弦 值 
oo F 的 正切 值 
mw fio 值 域 为 [mw 2, r 2]， 其 中 xE[。1, 1] 





oo ee 值 域 为 [0, rn]， 其 中 xE[ 1, 1] 
panes fav ERAI n 2, TV 2] 
atan2(y,x) tan“'(y/x)， 值 域 为 [en n] 


sinh(x) x 的 双 曲 正弦 值 


fone) | aaa 
lenco | 的 双 曲 正切 值 


il 


_—— E 
exp(x) 


Jd 
peo amt, sea 
pwo faao MIRIA 0) JRA 


pow(xy) x’ 。 如 果 x=0 H y 运 0， 或 者 x<0 H y 不 是 整 型 数 ， 将 
产生 定义 
域 错误 


mo fav 其 中 sito 
co p x 的 最 小 整 型 数 ， 其 中 x 的 类 型 为 double 
feo) fcr x 的 最 大 整 型 数 ， 其 中 x 的 类 型 为 double 








frexp(x, int *ip) 上 把 x 分 成 一 个 在 [1/2, 1] 区 间 内 的 真 分 数 和 一 个 2 的 军 
数 。 结 


ee 并 将 军 数 保存 在 *exp Fo WR 
x AO, 


| fei cu 


分 成 整数 和 小 数 两 部 分 ， 两 部 分 的 正 负 号 均 坪 
司 。 该 函 


数 返 回 小 数 部 分 ， 整 数 部 分 保存 在 “ 认 中 


求 JJy 的 浮 点 余数 ， 符 号 与 j 相同 。 如 果 y AO, Wei 
果 与 具体 


的 实现 相关 





B.5 实用 函数 :<stdlib.h> 


头 文件 <stdlibh> 中 声明 了 一 些 执行 数值 转换 、 内 存 分 配 以 及 其 它 类 似 工 
作 的 函数 。 


double atof(const char *s) 


atof 函数 将 字符 串 s 转 HON double 类 型 。 该 函数 等 价 于 strtod (s, 
(char**)NULL). 


int atoi(const char *s) 


atoi 函数 将 字符 串 s 转换 为 int RAY. 该 函数 等 价 于 (int)strtol(s, 
(char**)NULL, 10)。 


long atol(const char *s) 


atol 函数 将 字符 串 s 转换 为 long 类 型 。 该 函数 等 价 于 strtol(s, 
(char**)NULL, 10)。 


double strtod(const char *s, char **endp) 


strtod 函数 将 字符 串 s 的 前 级 转换 为 double 类 型 ， 并 在 转换 时 跳 过 s 的 
METH. 除了 endp 为 NULL， 人 否则 该 函数 将 把 指 同 s 中 未 转换 部 
分 (s 的 后 缀 部 分 ) 的 指针 保存 在 *endp 中 。 如 果 结 果 上 洲 ， 则 函数 返回 带 
有 适当 符号 HUGE_VAL; 如 果 结 果 下 洲 ， 则 返回 0。 在 这 两 种 情况 下 ， 
errno 都 将 被 设置 为 ERANGE。 





long strtol(const char *s, char **endp, int base) 


strtol 函数 将 字符 串 s 的 前 级 转换 为 long 类 型 ， 并 在 转换 时 跳 过 s 的 前 
导 空 白 符 。 除 非 endp 为 NULL， 和 否则 该 函数 将 把 指 癌 s 中 末 转 换 部 分 
(s 的 后 辍 部 分 ) 的 指针 保存 在 *endp 中 。 如 果 base 的 取 值 在 2036 之 间 ， 
则 假定 输入 是 以 该 数 为 基底 的 ;如 果 base 的 取 值 为 0， 则 基底 为 八 进 
制 、 十 进 制 或 十 六 进 制 。 以 0 为 前 级 的 是 八进制 ， 以 Ox BK OX 为 前 绥 
的 是 十 六 进 制 。 无 论 在 哪 种 情况 下 。 字 母 均 表示 10mbase*1 之 间 的 数 
字 。 如 果 base 值 是 16， 则 可 以 加 上 前 导 Ox 或 0X。 如 果 结 果 上 游 ， 则 
函数 根据 结果 的 符号 返回 LONG_MAX 或 LONG_MIN， 同时 将 errno 
的 值 设置 为 ERANGE。 





unsigned long strtoul(const char *s, char **endp, int base) 


strtoul 函数 的 功能 与 strtol ALTAIR], ERAR unsigned long 类 型 ， 
错误 值 为 ULONG_MAX。 


int rand(void) 


rand 函数 产生 一 个 ONRAND_ MAX 之 间 的 伪 随 机 整数 。RAND_MAX 的 
取 值 至 少 为 32767。 


void srand(unsigned int seed) 


srand pk ACK seed 作为 生成 新 的 伪 随 机 数 序列 的 种 子 数 。 种 子 数 seed 的 


初 值 为 1。 
void *calloc(size_t nobj, size_t size) 


calloc 函数 为 由 nobj PKN size 的 对 象 组 成 的 数组 分 配 内 存 ， 并 返回 
指 回 分 配 区 域 的 指针 ;大 无 法 满足 要 求 ， 则 返回 NULL 。 该 空间 的 初始 
长 度 为 0 F 


void *malloc(size_t size) 


malloc 函数 为 长 度 为 size 的 对 象 分 配 内 存 ， 并 返回 指 癌 分 配 区 域 的 指 
E 要 求 ， 则 返回 NULL。 该 函数 不 对 分 配 的 内 存 区 域 进行 
初始 


void *realloc(void *p, size_t size) 


realloc 函数 将 p FRI TRA IKEMBRN size 个 字 节 。 如 果 新 分 配 的 内 
存 比 原 内 存 大 ， 则 原 内 存 的 内 容 保持 不 变 ， 增 加 的 空间 不 进行 初始 
化 。 如 果 新 分 配 的 内 存 比 原 内 存 小 ， 则 新 分 配 内 存单 元 不 被 初始 

化 :realloc 函数 返回 指向 新 分 配 空间 的 指针 ; 若 无 法 满足 要 求 ， 则 返回 
NULL。 在 这 种 情况 下 ， 原 指针 p 指向 的 单元 内 容 保 持 不 变 。 








void free(void *p) 


free 函数 释放 p ARAETA. “4 p 的 值 为 NULL 时 ， 该 函数 不 执行 
任何 操作 。P 必 须 指 癌 先 前 使 用 动态 分 配 函 数 malloe、realloc 或 calloc 
分 配 的 空间 。 





void abort(void) 


abort PAA REP EESE. HHS raise(SIGABRT) 类 似 。 void 


exit(int status) 


exit 国 数 使 程序 正和 终止 。atexit 函数 的 调用 顺序 与 登记 的 顺序 相反 ， 
这 种 情况 下 ， 所 有 已 打开 的 文件 缓冲 区 将 被 清洗 ， 所 有 已 打开 的 流 将 
被 关闭 ， 控 制 也 将 返回 给 环境 。status 


的 值 如 何 返 回 给 环境 要 视 具 体 的 实现 而 定 ， 但 0 值 表 示 终 止 成 功 。 也 可 
使 用 值 EXIT_SUCCESS 





和 EXIT_FAILURE 作为 返回 值 。 
int atexit(void (*fcn)(void)) 


atexit 函数 登记 函数 fcn， 该 函数 将 在 程序 正和 终止 时 被 调用 。 如 果 登 记 
失败 ， 则 返回 非 0 值 。 


int system(const char *s) 


system 函数 将 字符 串 s 传递 给 执行 环境 。 如 果 s 的 值 为 NULL， fae 
命令 处 理 程序 ， 则 该 函数 返回 非 0 值 。 如 果 s 的 值 不 是 NULL， 则 返 
值 与 具体 的 实现 有 关 。 


char *getenv(const char *name) 


a 函数 返回 与 name 有关 的 环境 字符 串 。 如 果 该 字符 串 不 存在 ， 则 
返回 NULL。 其 细节 与 具体 的 实现 有 关 。 


void *bsearch(const void *key, const void *base, size_t n, size_t size, 
int (*cmp)(const void *keyval, const void *datum)) 


bsearch 函数 在 base[0]...base[n*1] 之 间 查 找 与 *key 匹配 的 页 。 TE PKI 数 
cmp 中 ， 如 果 第 一 个 参数 (查找 关键 字 ) 小 于 第 二 个 参数 ( 表 页 )， 它 必须 
返回 一 个 负 值 ;如 果 第 一 个 参数 等 于 第 二 个 参数 ， 它 必须 返回 零 ; 
一 个 参数 大 于 第 二 个 参数 ， 它 必须 返回 一 个 正 值 。 数 组 base 中 的 页 








须 按 升序 排列 。bsearch 函数 返回 一 个 指针 ， 它 指 同 一 个 匹配 页 ， 如 果 
不 存在 匹配 页 ， 则 返回 NULL. 





void qsort(void *base, size_t n, size_t size, int (*cmp)(const void *, const 
void *)) 


qsort 函数 对 base[0]...base[n*1] 数 组 中 的 对 象 进行 升序 排序 ， 数 组 中 每 个 
对 象 的 长度 为 size。 比 较 函 数 cmp 与 bsearch 函数 中 的 描述 相同 。 


int abs(int n) 

abs ek BOK [al int 类 型 参数 n 的 绝对 值 。 
long labs(long n) 

labs 函数 返回 long 类 型 参数 n 的 绝对 值 。 
div_t div(int num, int denom) 


div 函数 计算 num/denom 的 商 和 余数 ， 并 把 结果 分 别 保 存在 结构 类 型 
div_t 的 两 个 int 


类 型 的 成 员 quot 和 rem 中 。 
ldiv_t ldiv(long num, long denom) 


idiv 函数 计算 num/denom 的 商 和 余数 ， 并 把 结果 分 别 保存 在 结构 类 型 
idiv_t 的 两 个 


long 类 型 的 成 员 quot 和 rem 中 。 

B.6 12 Wr :<assert.h> 

assert 宏 用 于 为 程序 增加 诊断 功能 。 其 形式 如 下 : 

void assert(int expression) 

OUR BUT th FY 

assert(expression) 

时 ， 表 达 式 的 值 为 0， 则 assert 宏 将 在 stderr 中 打印 一 条 消息 ， 比 如 : 
Assertion failed: 表 连 式 , file 源 文件 名 , line 行 号 


打印 消息 后 ， 该 宏 将 调用 abort 终止 程序 的 执行 。 其 中 的 源 文件 名 和 行 
OR AF Tb EE ak 


FILE 及 LINE_. 


如 果 定 义 了 安 NDEBUG， 同 时 又 包 售 了 头 文 件 <asserth>， 则 assert Z 
将 被 忽略 。 


B.7 可 变 参 数 表 :<stdarg.h> 

头 文 件 <stdarg.h> 提 供 了 遍历 未 知 数 日 和 类 型 的 函数 参数 表 的 功能 。 
假定 函数 f 带 有 可 变数 目的 实际 参数 ，lastarg 是 它 的 最 后 一 个 命名 的 形 
式 参 数 。 那 么 ， 在 函数 f 内 声明 一 个 类 型 为 va_list 的 变量 ap, EKK 
次 指 问 每 个 实际 参数 : 

va_list ap; 

在 访问 任何 未 命名 的 参数 前 ， 必 须 用 va 一 start 宏 初 始 化 ap 一 次 : 


va_start(va_list ap, lastarg); 





此 后 ， 每 次 执行 宏 va_arg 都 将 产生 一 个 与 下 一 个 未 命名 的 参数 具有 相 
同类 型 和 数值 的 值 ， 它 同时 还 修改 ap， 以 使 得 下 一 次 执行 va_arg 时 返 
回 下 一 个 参数 : 

type va_arg(va_list ap, type); 


在 所 有 的 参数 处 理 完毕 之 后 ， 且 在 退出 函数 f 之 前 ， 必 须 调用 宏 va_end 
一 次 ， 如 下 所 示 : 


void va_end(va_list ap); 


B.8 非 局 部 跳 转 :<setjmp.h> 


头 文件 <setjimp.h> 中 的 声明 提供 了 一 种 不 同 于 通 币 的 函数 调用 和 返回 顺 
序 的 方式 ， 特 别 是 ， 它 允许 立即 从 一 个 深层 从 套 的 函数 调用 中 返回 。 


int setjmp(jmp_buf env) 


setjmp 宏 将 状态 信息 保存 到 env 中 ， 供 longjmp 使 用 。 如 果 直 接 调用 
setimp， 则 返 


回 值 为 0; 如 果 是 在 longjmp 中 调用 setjmp， 则 返回 值 为 非 0。Setjmp 只 
能 用 于 某 些 上 下 文中 ， 如 用 于 让 语句 、switch 语句 、 循 环 语句 的 条 件 
测试 中 以 及 一 些 简单 的 关系 表达 式 中 。 例如 : 


if (setjmp(env) == 0) 
/* get here on direct call */ else 
/* get here by calling longjmp */ void longjmp(jmp_buf env, int val) 


longjmp 通过 最 近 一 次 调用 setimp 时 保存 到 env 中 的 信息 恢复 状态 ， 同 
时 ， 程 序 重新 恢复 执行 ， 其 状态 等 同 于 setjmp 宏 调用 刚刚 执行 完 并 返 
回 非 0 值 val。 包 含 setjmp 宏 调 用 的 函数 的 执行 必须 还 没有 终止 。 除 下 
列 情况 外 ， 可 访问 对 象 的 值 同调 用 longjmp 时 的 值 相 同 : 在 调用 setjmp 
宏 后 ， 如 果 调 用 setimp 宏 的 函数 中 的 非 volatile 目 动 变量 改变 了 ， 则 它 
们 将 变 成 未 定义 状态 。 














B.9 信号 :<signal.h> 








头 文件 <signal.h> 提 供 了 一 些 处 理 程序 运行 期 间 引 发 的 各 种 异常 条 件 的 
功能 ， 比 如 来 源 于 外 部 的 中 断 信号 或 程序 执行 错误 引起 的 中 断 信 和 号。 


void (*signal(int sig, void (*handler)(int)))(int) 





signal 决定 了 如 何 处 理 后 续 的 信号 。 如 果 handler 的 值 是 SIG_DFL， 则 

采用 由 实现 定义 的 默认 行为 ;如 果 handler 的 值 是 SIG_IGN， 则 忽略 该 信 
号 ;人 否则 ， 调 用 handler 指 癌 的 函数 (以 信号 作为 参数 )。 有 效 的 信号 包括 : 
SIGABRT 异常 终止 ， 例 如 由 abort 引起 的 终止 SIGFPE 算 

o 如 除数 为 0 或 溢出 SIGILL 非法 函数 映像 ， 如 非法 
日 ~ 

SIGINT 用 于 交互 式 目的 信号 ， 如 中 断 

SIGSEGV 非法 存储 器 访问 ， 如 访问 不 存在 的 内 存单 元 

SIGTERM 发 送 给 程序 的 终止 请 求 





对 于 特定 的 信号 ，signal 将 返回 handler 的 前 一 个 值 ; 如 果 出 现 错 误 ， 则 
返回 值 SIG_ERR。 当 随 后 碰 到 信号 sig 时 ， 该 信号 将 恢复 为 默认 行 
为 ， 随 后 调用 信和 号 处 理 程 序 ， 就 好 像 由 


(*handlem(sig) 调 用 的 一 样 。 信 和 号 处 理 程序 返回 后 ， 程 序 将 从 信号 发 生 的 
位 置 重新 开始 


执行 。 

言 写 的 初始 状态 由 具体 的 实现 定义 。 

int raise(int sig) 

raise 回程 序 发 送信 号 sig。 如 果 发 送 不 成 功 ， 则 返回 一 个 非 0 值 。 
B.10 H #445 Fy TB) eK 2: <time.h> 

头 文件 <time.h> 中 声明 了 一 些 处 理 日 期 与 时 间 的 类 型 和 函数 。 其 中 的 一 


些 函 数 用 于 处 理 当地 时 间 ， 因 为 时 区 等 原 同 ， 当 地 时 间 与 日 历时 间 可 
能 不 相同 。clock_t 和 time t 是 两 个 








表示 时 间 的 算术 类 型 ，struct tm 用 于 保存 日 历时 间 的 各 个 构成 部 分 。 结 
构 tm 中 各 成 员 的 用 途 及 取 值 范围 如 下 所 示 : 


从 当前 分 钟 开始 经 过 的 秒 数 (0, 61) 


从 当前 小 时 开始 经 过 的 分 钟 数 (0, 59) 





hour; | 从 午夜 开始 经 过 的 小 时 数 (0, 23) 


六 当月 的 天 数 (1, 31) 


从 1 月 起 经 过 的 月 数 (0, 11) 


— 3 


从 1900 年 起 经 过 的 年 数 


3 


_wday; AE JABAL HY KACO, 6) 


3 


从 1 月 1 日 起 经 过 的 天 数 (0, 365) 


int}tm_isdst; | 夏令 时 标记 


— 
= 
ot 


= 





用 令 时 ，tm_isdst 的 值 为 正 ， 否 则 为 0。 如 果 该 信息 无 效 ， 则 其 值 为 


4 


clock_t clock(void) 


clock 函数 返回 程序 开始 执行 后 占用 的 处 理 器 时 间 。 如 果 无 法 获取 处 理 
器 时 间 ， 则 返回 值 为 。1。clockOMCLOCKS_PER_SEC 是 以 秒 为 单位 表示 
的 时 间 。 


time_t time(time_t *tp) 


time 函数 返回 当前 日 历时 间 。 如 果 无 法 获取 日 历时 间 ， 则 返回 值 为 "1。 
WR 印 不 是 NULL， 则 同时 将 返回 值 赋 给 *tp。 





double difftime(time_t time2, time_t time1) difftime 函数 返回 time2¢time1 
的 值 (以 秒 为 单位 )。 

time_t mktime(struct tm *tp) 

mktime 函数 将 结构 *tp 中 的 当地 时 间 转 换 为 与 time 表示 方式 相同 的 日 历 
时 间 ， 结 构 中 各 成 员 的 值 位 于 上 面 所 示范 围 之 内 。mktime 函数 返回 转 
换 后 得 到 的 日 历时 间 ; 如 果 该 时 间 不 能 表示 ， 则 返回 "1。 


下 面 4 个 函数 返回 指向 可 被 其 它 调 用 禾 盖 的 静态 对 象 的 指针 。 








char *asctime(const struct tm *tp) 
asctime 函数 将 结构 *tp 中 的 时 间 转 换 为 下 列 所 示 的 字符 串 形 式 : 
Sun Jan 3 15:14:13 1988\n\0 char *ctime(const time_t *tp) 


ctime 函数 将 结构 *tp 中 的 日 历时 间 转 换 为 当地 时 间 。 它 等 价 于 下 列 函 数 
调用 : 


asctime(localtime(tp)) 


struct tm *gmtime(const time_t *tp) 


gmtime 函数 将 *tp 中 的 日 历时 间 转 换 为 协调 世界 时 (UTC)。 如 果 无 法 获 
取 UTC, W AORE NULL. AAZ FY gmtime 有 一 定 的 历史 意义 。 


struct tm *localtime(const time_t *tp) localtime 函数 将 结构 *tp 中 的 日 历时 


间 转 换 为 当地 时 间 。 


size_t strftime(char *s, size_t smax, const char *fmt, const struct tm 
*tp) 


strftime 函数 根据 fmt 中 的 格式 把 结构 *tp 中 的 日 期 与 时 间 信 息 转 换 为 指 
定 的 格式 ， 并 存储 到 s 中 ， 其 中 fmt 类 似 于 printf 函数 中 的 格式 说 明 。 
普通 字符 (包括 终结 符 \0') 将 复制 到 s 中 。 每 个 %c 将 按照 下 面 描述 的 格 
式 蔡 换 为 与 本 地 环境 相 适 应 的 值 。 最 多 smax 个 字符 写 到 s 中 。strftime 
函数 返回 实际 写 到 s 中 的 字符 数 (不 包括 字符 \0); 如 果 字 符 数 多 于 
smax， 该 函数 将 返回 值 0。 


fmt 的 转换 说 明 及 其 含义 如 下 所 示 : 


%a 一 星期 中 各 天 的 缩写 名 
%A 一 星期 中 各 天 的 全 名 
%b 缩写 的 月 份 名 


%B 月 份 全 名 
%c 当地 时 间 和 日 期 表示 


%d 一 个 月 中 的 某 一 天 (01*31) 

%H 小 时 (24 小 时 表示 )(00*23) 

9%6I 小 时 (12 小 时 表示 )(01*12) 

%j 一 年 中 的 各 天 (001 一 366) 

%m 月 份 (01*12) 

%M 分 钟 (00*59) 

%p 与 AM 与 PM 相应 的 当地 时 间 等 价 表 示 方 法 


%S 秒 (00*61) 





%U 一 年 中 的 星期 序号 (0053， 将 星期 日 看 作 是 每 周 的 第 一 天 ) 
%w 一 周 中 的 各 天 (0"6， 星 期 日 为 0) 

%W 一 年 中 的 星期 序号 (0053， 将 星期 一 看 作 是 每 周 的 第 一 天 ) 
%x 当地 日 期 表示 

%X 当地 时 间 表 示 

%y 不 带 志 纪 数 目的 年 份 (00*99) 

%Y 带 世 纪 数 目的 年 份 

9%6Z 时 区 名 (如 果 有 的 话 ) 


%% % AS 
B.11 与 具体 实现 相关 的 限制 :<limits.h> 和 <float.h> 


头 文 件 <limits.h> 定 义 了 一 些 表 示 整 型 大 小 的 和 常量。 以 下 所 列 的 值 是 可 接 
受 的 最 小 值 ， 在 实际 系统 中 可 以 使 用 更 大 的 值 。 

















cnar f 或 SCHAR_MIN char 类 型 的 最 小 值 
INT_MAX mw 类 型 的 最 大 值 


| | 


eee i 类 型 的 最 小 值 


LONG_MAX]]2147483647 long 类 型 的 最 大 值 
LONG_MIN |*2147483647 long 类 型 的 最 小 值 





signed char 类 型 的 最 大 值 
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signed char 类 型 的 最 小 值 
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short 类 型 的 最 大 值 
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short 类 型 的 最 小 值 
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ocna max unsigned char 类 型 的 最 大 值 


UINT_MAX 


prone max 


U 


65535 unsigend int 类 型 的 最 大 值 


rs rs 
rs Wy 


i 类 型 的 最 大 值 


es unsigned short 类 型 的 最 大 值 


下 表 列 出 的 名 字 是 <float.h> 的 一 个 子 集 ， 它 们 是 与 浮 点 算术 运算 相关 的 
ee 给 出 的 每 个 值 代表 相应 量 的 最 小 取 值 。 各 个 实现 可 以 定义 
ia SWB. 


rm 
O 
Z 
A 
z 
> 
>< 
= 
z 
ga 
5 
© 
A 
o 
5 
ga 


n 
E 
vs) 
= 
z 
> 
>< 

















FLT_RADIX FLT_ROUNDS 2 指数 表示 的 基数 ， 例 如 2、16 
FLT_DIG FLT EPSILON 加 法 的 浮 点 舍 入 模式 表示 精度 
FLT MANT DIG 6 的 十 进 制 数字 


1E*5 最 小 的 数 x，x 满足 :1.0 + x 


1.0 


尾数 中 的 数 (以 FLT_RADIX 为 
基数 ) 


Vi 


= 


FLT_MAX FLT MAX EXP 


最 大 的 数 n，n 满足 
FLT_RADIX"1 仍 是 可 表示 的 


hs 点 数 
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最 小 的 规格 化 浮 点 数 


最 小 的 数 n，n 满足 :10 "是 一 
个 规格 化 数 
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表示 精度 的 十 进 制 数字 


DBL_DIG 
DBL_EPSILON 
DBL_MANT_DIG 


DBL_MAX DBL MAX EXP 


最 小 的 数 x，X 满足 :1.0 + x 
1.0 


尾数 中 的 数 ( 以 FLT_RADIX 为 


基数 ) 











1E+37| 最 大 的 双 精 度 浮 点 数 
最 大 的 数 n，n 满足 


FLT_RADIX"1 仍 是 可 表示 的 











i= 


DBL_MIN DBL_MIN_EXP °37 | 最 小 


的 规格 化 双 精 度 浮 点 数 


最 小 的 数 n，n 满足 :10 "是 一 
个 规格 化 数 





附录 C 变更 小 结 


目 本 书 第 1 版 出 版 以 来 ，C 语言 的 定义 已 经 发 生 了 一 些 变化 。 几 乎 每 次 
变化 都 是 对 原 语言 的 一 次 扩充 ， 同 时 每 次 扩充 都 是 经 过 精心 设计 的 ， 
并 保持 了 与 现 有 版 本 的 兼容 性 ;其 中 的 一 些 修改 修正 了 原版 本 中 的 歧义 
性 描述 ; 茶 些 修改 是 对 己 有 版 本 的 变更 。 许 多 新 增 功能 都 是 随 AT&T $e 
供 的 编译 器 的 文档 一 同 发 布 的 ， 并 个 此 后 的 其 它 C PE ae ED TE ACA o 
BDA, ANSI 标准 化 协会 在 对 C 语言 进行 标准 化 时 采纳 了 其 中 绝 大 部 
分 的 修改 ， 并 进行 了 其 它 一 些 重要 修 正 。 甚 至 在 正式 的 C 标准 发 布 之 
HU, ANSI 的 报告 就 已 经 被 一 些 编译 占 提 供 商 部 分 地 先期 采用 T o 


本 附录 总 结 了 本 书 第 1 版 定义 的 C 语言 与 ANSI 新 标准 之 间 的 差别 。 我 
们 在 这 里 仅 讨论 语言 本 里， 不 涉及 环境 和 库 。 尺 管 环境 和 库 也 是 标准 
的 重要 组 成 部 分 ， 但 它们 与 第 1 版 几乎 


无 可 比 之 处 ， 因 为 第 1 版 并 没有 试图 规定 一 个 环境 或 库 。 


与 第 1 版 相 比 ， 标 准 C 中 关于 预 处 理 的 定义 更 加 细致 ， 并 进 
行 了 扩充 :明确 以 记号 为 基础 ;增加 了 连接 记号 的 运算 符 ( 硕 ) 和 生成 字符 
串 的 运算 符 ( 芍 ;增加 了 新 的 控制 指令 (如 #elif 和 #pragma); 明 确 允 许 使 用 
相同 记号 序列 重新 声明 宏 ;字符 串 中 的 形式 参数 不 再 被 蔡 换 。 人 允许 在 任 
何 地 方 使 用 反 和 斜 杜 字 “\" 进 行 行 的 连接 ， 而 不 仅仅 限于 在 字符 串 和 宏 定 
义 中 。 详 细 信 息 参 见 A.12 WW. 


所 有 内 部 标识 符 的 最 小 有 效 长 度 增加 为 31 个 字符 ;具有 外 部 连 
接 的 标识 符 的 最 小 有 效 长 度 仍然 为 6 个 字符 (很 多 实现 中 允许 更 长 的 标 


识 符 )。 





























通过 双 问 号 ” ??" 引 入 的 三 字符 序列 可 以 表示 茶 些 字符 集 
中 缺少 的 字符 。 定 义 了 #、 








\、^、[、]、{、}、|、~ 等 转 义 字符 ， 参 见 A.12.1 节 。 注 意 ， 三 字符 序 
列 的 引入 
可 能 会 改变 包含 “??" 的 字符 串 的 含义 。 


引入 了 一 些 新 关键 字 (void、const、volatile、signed 和 enum). 
关键 字 entry 


将 不 再 使 用 。 

定义 了 字符 常量 和 字符 串 字 面值 中 使 用 的 新 转 义 字符 序列 。 如 
果 \ 及 其 后 字符 构成 的 不 是 转 义 序列 ， 则 其 结果 是 未 定义 的 。 参 见 
A.2.5 节 。 

所 有 人 都 喜欢 的 一 个 小 变化 :8 和 9 不 用 作 八 进 制 数字 。 


新 标准 引入 了 更 大 的 后 缀 集合 ， 使 得 和 常量 的 类 型 更 加 明确 :U 
或 工 用 于 整 型 ，F 或 工 


用 于 浮 点 数 。 它 同时 也 细 化 了 无 后 级 常量 类 型 的 相关 规则 (参见 A.2.5 
证 )。 











相 邻 的 字符 串 将 被 连接 在 一 起 。 


提供 了 宽 字 符 字 符 串 字面 值 和 字符 常量 的 表示 方法 ， 参 见 
A.2.6 节 。 


与 其 它 类 型 一 样 ， 对 字符 类 型 也 可 以 使 用 关键 字 signed 或 
unsigned 显 式 声明 为 带 符 写 类 型 或 无 人 符 写 类 型 。 放 弃 了 将 long float 作 
为 double 的 同义词 这 种 独特 
的 用 法 ， 但 可 以 用 long double 声明 更 高 精度 的 浮 点 数 。 


有 上段 时 间 ，C 语言 中 可 以 使 用 unsigned char 类 型 。 新 标准 引入 
了 关键 字 signed, 用 来 显 式 表示 字符 和 其 它 整 型 对 象 的 符号 。 


很 多 编译 器 在 几 年 前 就 实现 了 void 类 型 。 新 标准 引入 了 void * 
类 型 ， 并 作为 一 种 通用 指针 类 型 ;在 此 之 前 char * 扮 演 着 这 一 角色 。 同 
时 ， 明 确 地 规定 了 在 不 进行 强 


ah 指针 与 整 型 之 间 以 及 不 同类 型 的 指针 之 间 运 算 的 
H 











新 标准 明确 指定 了 算术 类 型 取 值 范 围 的 最 小 值 ， 并 在 两 个 头 文 
件 (<limits.h> 和 


<float.h>) 中 给 出 了 各 种 特定 实现 的 特性 。 
新 增加 的 枚 举 类 型 是 第 1 版 中 所 没有 的 。 
标准 采用 了 C++ 中 的 类 型 限定 符 的 概念 ， 如 const( 参 见 A.8.2 


字符 串 不 再 是 可 以 修改 的 ， 因 此 可 以 放 在 只 读 内 存 区 中 。 

修改 了 "普通 算术 类 型 转换 "， 特 别 地 ，" 整 型 总 是 转换 为 
unsigned 类 型 ， 浮 点 数 总 是 转换 为 double 类 型 "已 更 改 为 "提升 到 最 小 的 
足够 大 的 类 型 "。 参 见 A.6.5 节 。 

日 的 赋值 类 运算 符 ( 如 =+) 已 不 再 使 用 。 同 时 ， 赋 值 类 运算 符 现 
在 是 单个 记号 ;而 在 第 1 版 中 ， 它 们 是 两 个 记号 ， 中 间 可 以 用 空白 符 分 
Fe 


FE on Ea P PERR En ai a ERIT at Ete n 





为 了 保持 与 一 元 运算 符 的 对 称 ， 引 入 了 一 元 运算 符 +。 


指向 函数 的 指针 可 以 作为 函数 的 标志 符 ， 而 不 需要 显 式 的 * 运 
算 符 。 参 见 A.7.3 T. 


结构 可 以 被 赋值 、 传 递 给 函数 以 及 被 函数 返回 。 

允许 对 数组 应 用 地 址 运算 符 ， 其 结果 为 指 同 数组 的 指针 。 

在 第 1 版 中 ，sizeof 运算 符 的 结果 类 型 为 int， 但 随后 很 多 编译 
器 的 实现 将 此 结果 作为 unsigned 类 型 。 标 准 明 确 了 该 运算 符 的 结果 类 
型 与 具体 的 实现 有 关 ， 但 要 求 


将 其 类 型 size_t 在 标准 头 文件 <stddef.h> 中 定义 。 关 于 两 个 指针 的 差 的 结 
RA 型 (ptrdiff_t) 也 有 类 似 的 变化 。 参 见 A.7.4 节 与 A.7.7 节 。 


地 址 运算 符 && 不 可 应 用 于 声明 为 ”register 的 对 象 ， 即 使 具体 的 
实现 未 将 这 种 对 象 存 放 在 寄存 器 中 也 不 允许 使 用 地 址 运算 符 。 


移 位 表达 式 的 类 型 是 其 左 操作 数 的 类 型 ， 右 操作 数 不 能 提升 结 
果 类 型 。 参见 A.7.8 节 。 


标准 允许 创建 一 个 指 疝 数组 最 后 一 个 元 素 的 下 一 个 位 置 的 指 
针 ， 并 允许 对 其 进行 算 术 和 关系 运算 。 参 见 A.7.7 市 。 


标准 (借鉴 于 ”C++) 引 入 了 函数 原型 声明 的 表示 法 ， 函 数 原 型 
中 可 以 声明 变 元 的 类 型 。 同 时 ， 标 准 中 还 规定 了 显 式 声明 带 可 变 变 元 
表 的 函数 的 方法 ， 并 提供 了 一 种 被 
认可 的 处 理 可 变形 式 参 数 表 的 方法 。 参 见 A.7.3 节 、A.8.6 节 和 B.7 节 。 
旧式 声明 的 函数 仍然 可 以 使 用 ， 但 有 一 定 限 制 。 

标准 禁止 空 声明 ， 即 没有 声明 符 ， 且 没有 至 少 声明 一 个 结构 ， 
联合 或 枚 举 的 声明 。 另 一 方面 ， 仅 仅 只 带 结 构 标 记 或 联合 标记 的 声明 
是 对 该 标记 的 重新 声明 ， 即 使 该 标 
记 声 明 在 外 层 作 用 域 中 也 是 这 样 。 

禁止 没有 任何 说 明 符 或 限定 符 (只 是 一 个 空 的 声明 符 ) 的 外 部 数 
据说 明 。 

在 某 些 实现 中 ， 如 果 内 层 程 序 块 中 包含 一 个 extern 声明 ， 则 该 


声明 对 该 文件 的 其 它 部 分 可 见 。ANSI 标准 明确 规定 ， 这 种 声明 的 作用 
域 仅 为 该 程序 块 。 


形式 参数 的 作用 域 扩 展 到 函数 的 复合 语 名 中， 因此， 函数 中 最 
顶层 的 变量 声明 不 能 与 形式 参数 冲突 。 


标识 符 的 名 字 空 间 有 一 些 变化 。ANSI 标准 将 所 有 的 标号 放 在 
个 单独 的 名 字 空 间 中 ， 同时 也 为 标号 引入 了 一 个 单独 的 名 字 空 间 ， 参 
JL A.1.1 节 。 结 构 或 联合 的 成 员 名 将 与 
其 所 属 的 结构 或 联合 相关 联 (这 已 经 是 许多 实现 的 共同 做 法 了 )。 


联合 可 以 进行 初始 化 ， 初 值 引 用 其 第 一 个 成 员 。 









































目 动 结构 、 联 合 和 数组 可 以 进行 初始 化 ， 但 有 一 些 限制 。 


显 式 指定 长 度 的 字符 数组 可 以 用 与 此 长 度 相 同 的 字符 串 字 面值 
初始 化 (不 包括 字符 


\0). 
switch 语句 的 控制 表达 式 和 case 标号 可 以 是 任意 整 型 。 
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